这阵风,是由一个数学问题引起的。
主席台上有三扇门,主持人事先在每扇门后各放了一个礼品。其中一扇门后是一两豪华跑车,而另外两扇后面各有一头漂亮的驴。主持人告诉大家:现在随机抽取一位幸运观众,由他随意选一扇门,门后的礼品就是他的奖品。虽然两只驴很漂亮,所有人都更喜欢豪华跑车。
幸运观众选好一扇门牌,门尚未打开。主持人在剩下的两扇门中有意打开了一扇有驴的门,然后问幸运儿,愿不愿与剩下的门交换。这位观众挠挠脑袋,拿不定主意。
聪明的读者,假如您是那个幸运儿,是换,还是不换?
这的确是一个有意思的问题。有人给当时IQ最高的Marilyn vos Savant写信请教。Marilyn vos Savant是IQ在吉尼斯的记录保持者,其IQ高达228分。Marilyn vos Savant信中说,该换,并且解释说:如不换,他得到跑车的概率是1/3,换以后得到跑车的概率将升至2/3。这封信发表在1990年Parade杂志的“Ask Marilyn”栏目中。
不料想,这样一封信,就象一阵风,吹皱了一池春水。或者更准确地说,是掀起了轩然大波。
当时有不少数学家和统计学家加入了声讨Marilyn vos Savant的行列。他们认为Marilyn vos Savant犯了很低级的错误,有人甚至要求Marilyn vos Savant为所犯的错误向公众道歉。而事实上,犯错的不是Marilyn vos Savant,而是他们自己。
为什么会这样呢?因为这有悖于大家的直觉。
直觉是什么呢?一般人的直觉是,既然跑车在剩下的门中,换与不换没有差别,每个门后有车的概率就都是1/2。
在这里,直觉是明显有漏洞的。为什么呀?
在主持人没有打开一扇有驴的门以前,幸运观众选择的门后有车的概率是1/3。为什么在打开一扇有驴的门之后,概率变成了1/2?因为礼品是主持放的,他总能准确地在两扇门中打开一扇有驴的门呀。假如这个直观是对的,就会产生下面的问题:观众随意选定一扇门,门后有车的概率,是1/3。而这时主持人只要打开另一扇有驴的门(这总是做得到的),观众所选门后有驴的概率就成了1/2,而他如果本想打开然后改变主意不打开,那扇门有驴的概率难不成又变回1/3?这是无论如何都难叫人心服口服的。
那么,为什么交换以后,有车的概率就从1/3升到2/3呢?这个问题,连当时的大数学家Paul Erdős都难以理解。他也直观的觉得,换不换都没有差别。
为什么有差别呢?这是因为主持人有意而不是随意打开了那扇有驴的门。
有意打开那扇有驴的门,就提共了有用的信息。想想看,如果他是在没有打开那扇有驴的门前问要不要换一扇门,答案又会如何?很显然,这时换不换是一样的,因为这时还有两种选择,他可能选中了那扇有驴的门,也可能选中了那扇有车的门。而现在,主持人帮他把有驴的门排除了。换句话说,主持做了对他有利的事,因此得到跑车的概率升高了。如果观众选中了有驴的门,交换必得利。只有在他选中了有车的门的情况下,交换才吃亏。也就是说,交换使他得到跑车的概率由1/3升到了2/3。再换一种说法,就更容易被接受了:如果交换的话,由于主持人的帮忙,在另外两扇门中的车,都是他的奖品。
什么是概率?概率,粗略地讲,就是一个未知事件发生的可能性的一个度量。度量的最大值为1,最小值为0。要把概率说清楚,就必须弄清楚什么是样本空间,什么是事件。样本空间是由一切可能发生的结果个体组成的集合,而事件则是由部分(当然也包函全部)结果个体组成的集合。如果排除样本空间为无限不可数的情形,可以说,概率为0的事件是不可能发生的事件,而概率为1的事件是必然发生的事件。其它事件的概率则在0和1之间。
要理解车和驴这个问题,有必要弄清楚这里的样本空间。我们不妨把三扇门标上号,比如该观众选中的是一号,剩下的分别是二号和三号。我们用(X,Y,Z,T)表示:一号门后有X,二号门后有Y,三号门后有Z,主持人打开的是T号门。那么,所有可能的结果是:
1:(车,驴,驴,二)
2:(车,驴,驴,三)
3:(驴,车,驴,三)
4:(驴,驴,车,二)
其中,(车,驴,驴,二)表示,一号门后有车,二号三号门后是驴,主持人打开的是二号门,而(车,驴,驴,三)则表示,一号门后有车,二号三号门后是驴,主持人打开的是三号门。
所以样本空间就是 Q ={(车,驴,驴,二),(车,驴,驴,三),(驴,车,驴,三),(驴,驴,车,二)}。虽然我们列出了四种可能的结果,1和2合起来的概率才是1/3。所以交换有利的情形是3和4,它们合起来的概率是2/3。直观上的1/2,很可能来自误解,认为四个结果是等可能的。
假如主持随意(就是他忘掉了自己的放法,或者礼品是别人放的,他不知情。)在两门当中选择一扇门,碰巧是一扇有驴的门,结果又会如何?
要弄清楚这个问题,就得了解一点条件概率。条件概率就是在已知部分信息的情况下,原有事件的概率会有一些变化。比方说,在已知今天下大雨的情况下,明天晴天的可能性会小一些。同样,如果今天艳阳高照,明天晴天的可能性就会大一些。假设有两个事件,分别称之为A和B。在不知任何部分信息的情况下,事件A发生的概率为P(A)。而如果事件B已发生,则A再发生的概率为P(A|B),我们可称之为:在已知事件B发生的情况下事件A发生的概率。一般说来,我们会有P(A)不等于P(A|B)。自然,也有可能P(A)=P(A|B),这时我们又称事件A和事件B相互独立。条件概率由下面的公式算得:P(A|B)=P(A和B都发生)/P(B)。
假如主持是随意打开剩下两扇门中的一扇门,会出现几种情况呢?也就是样本空间是什么呢?我们可以列出如下情形:
1:(车,驴,驴,二)
2:(车,驴,驴,三)
3:(驴,车,驴,二)
4:(驴,车,驴,三)
5:(驴,驴,车,二)
6:(驴,驴,车,三)
我们用(车,驴,驴,二)表示:一号门后是车,二号和三号门后是驴,主持人打开的是二号门。同样,(驴,驴,车,三)表示:一号和二号门后是驴,三号门后是车,主持人打开的是三号门。注意:在主持人有意的情况下,(驴,车,驴,二)和(驴,驴,车,三)是不可能发生的,因为他不会打开有车的门。这就是有意和随意的区别,也正是问题的关键。如果用A表示一号门后有车,而用B表示主持人打开有驴的门,让我们来算算,P(A|B)。因为P(B)=4/6=2/3,P(A和B同时发生)=2/6=1/3,所以P(A|B)=(1/3)/(2/3)=1/2。也就是说,在主持人随意打开一扇门,并且门后是驴的情况下,P(A|B)=1/2,这时交换门号毫无意义。
这也正是直觉上概率1/2的由来。
原来,那阵风的源头,来自有意和随意的一字之差。
请阅读更多我的博客文章>>>