上数据分析课的时候,一个同学挑衅,问了一个地雷
问题,“我们买彩票的时候,用机器自选号码,和自己填号码,有区别吗?”
全场鸦雀无声,有的同学还拿出了手机,准备录下本堂课的最精髓内容。
我毫不畏惧,慢慢讲开来。
“美国的情况,我不太清楚。加拿大的福利彩票,我可以回答你的提问。
首先,我们要理解加拿大的福利彩票开奖的机制,
它不与你填写的数字相关。它是用电脑软件产生的抽奖,
因为是社会福利为目的,完成了销售目标后,用百分之五十拿来回馈
购买者。为了达到广告效果,以促进更多的人购买,他们选择了
用时间和地点作为产生大奖的随机数发生器原始种子。
就是说,销售完成好的店铺和时间段,有更高的大奖机会。
现在,我可以回答你的提问了。
如果你购买彩票的地方和时间,是热卖的旺铺,是没有区别的。
如果你购买彩票地方是无人问津的冷店,基本上不能指望靠原始的种子
因素产生中大奖机会,而必须指望买中别人旺铺中奖人一样的号码,
而去分别人的一杯羹。
所以,自己填写数字会增加你中奖的机会,因为所有分布在全国各地的旺铺,都有
填写数字的同路人。这叫大数据分布造成的机会累计。
就相当于你们组团一起购买彩票,然后平分奖金。”
同学们听了都不愿意下课了。