论文部分内容阅读
蒙特卡洛是欧洲小国摩纳哥的一个沿海城市,素以富人聚集和博彩业繁华而著名,而所谓蒙特卡洛演算方法其实本来跟该城市毫无关联,不过是借了“赌城”的名头,玩笑般地剖白该方法的实质:上帝也会掷骰子。
是的,蒙特卡洛方法是一种随机模拟方法,其基本思想是对某个随机事件进行模拟演算,最终得到各种概率分布的随机变量,然后用统计方法将模型的数字特征估计出来,从而得到问题的数值解。
不熟悉的人可能会问,如果是纯粹掷骰子的方法,那么双方的胜平负概率不都是均等的吗?这有谁不会的呢,高盛还需要数据干什么?其实非也。因为蒙特卡洛虽说是随机模拟,它也是有不同权重的——比赛双方的实力不同,就好比在掷骰子比总数大小的时候,双方可以投掷的次数不同。
在竞技体育里面遵循蒙特卡洛方法而进行的事件里,NBA乐透抽签大概算是最有名的了。在NBA乐透抽签中,主持抽签的人会拿出编号为1-14的14个球,放入一个容器里,从中随机拿出4个球,而这4个球的组合就决定了状元签的归属。如果不计数字的先后顺序,这种抽签可以有1001种组合,其中1种被规定为“废票”,另外1000种组合被电脑随机分配给14支没有获得季后赛资格的球队。其中,战绩最差的球队能获得250种组合,也就是说,它赢得状元签的几率为25%;战绩最好的球队只有5种组合,中选几率就只有0.5%。
为什么说它随机呢?因为几率终归只是几率,250种组合只不过让你的机会比别人更大,却不能确保状元花落你家。事实上,自从NBA在1990年采用这种方法进行乐透抽签后,以最差战绩抽到状元签的只有4支球队;而2008年公牛抽中状元签的时候,他们事实上只有17种组合,也就是1.7%的中选概率。
于是让我们回到高盛的预测模型来,他们分配权重的依据当然不像NBA就看战绩那么简单。根据报告所言,除了Elo评分之外,高盛还将五个重要变量引入分析:
Q:预测帝能信吗?
A:确实有人能做到成功预测每一场比赛的胜负,甚至精确到比分。并不奇怪。从另一个角度讲,这与一个邮件骗局的思路是相同的。假设某骗子给90万人发邮件,以巴西对克罗地亚开始,任选一种结果(胜平负)随机发给30万人。然后在这场球结果出来后,给收到正确结果的30万人继续发下一场的预测。再正确一场后,给其中10万人继续发。于是,假设最后有10个人收到邮件,发现这个预测帝连续猜对了前面10场球的每一场,(然后相信他能继续正确,就把钱交给他赌一把)……因此,在一个预测帝成功的同时,千万个预测帝倒下了。
1.每支球队在过去10场主要国际赛事中的平均进球数;
2.每支球队在过去5场主要国际赛事中的平均丢球数;
3.每支球队的世界杯抽风指数——这个变量主要是看某支球队是否有在世界杯上发威或者突然哑火的倾向。当然了,要分析倾向,至少得有足够大的样本,所以高盛只选取了巴西、德国、阿根廷、西班牙、荷兰、英格兰、意大利和法国进行该指数研究;
4.每支球队在主场比赛的表现;
5.每支球队在所属大洲比赛时的表现。
有了这些指标,高盛就构造了一个分子模型,然后进行10万次的掷骰子模拟,得到每两支球队交锋时最可能出现的结果,进而得出一个“最合理”的世界杯预测。
巴西夺冠最合理?
10万次模拟之后,高盛的结果出炉——巴西将一路大胜到夺冠。
这其实非常好理解,我们可以挨个对照着高盛引入的6项指标来解析:在世界杯开赛前的Elo排名中,巴西队高居榜首,评分比西班牙高了27分;最近的主要国际赛事里,巴西在去年联合会杯中3比0大胜西班牙,4比2战胜意大利,进球数不少,丢球数不多;巴西队历史上5夺世界杯冠军,世界杯表现往往超出平时,绝不会像英格兰一样每逢大赛就抽风;再者,巴西是主场,根据高盛的计算,主场优势能让巴西每场多进0.4个球;另外,在美洲进行比赛也是大利好,平均每个美洲球队每场能多进0.2个球,而欧洲球队就比较惨了,历史上还没有欧洲球队在美洲举办的世界杯上夺冠的先例。
于是,按照这种预测,本届世界杯上最合理的情况就是,巴西队在小组赛分别以4比1、4比1和5比0大胜克罗地亚、墨西哥和喀麦隆,然后在第二轮3比1干掉荷兰,1/4决赛3比1击败乌拉圭,半决赛2比1淘汰德国,最后在决赛里3比1赢了老冤家阿根廷夺冠。
但是高盛也知道,所谓“合理”在足球运动里是很不靠谱的。因为足球不像篮球动辄打到100分以上,全场比赛0比0结束也是常有的事,而我们也知道,这种低进球的比赛同时就意味着极高的不可预测性——哪怕你全场压着对方打,全场射门比是50比2,射正比是25比1,结果人家门将神勇扑出了你所有的射门,就靠那仅有的一脚射正以1比0赢球,这种故事发生得还不够多么?所以,高盛认为,还是用蒙特卡洛方法计算一下每支队晋级不同阶段的概率是多大更靠谱。
于是又是一轮反复的掷骰子模拟实验,最终高盛得出结论,巴西队有99%的几率小组出线,78.8%的可能性进入八强,71.7%可能进入四强,进入决赛可能性达到60.3%,夺冠概率也高达48.5%!这可是个了不得的数字,要知道,欧洲开赌球盘口的人不过也只认为巴西有25%左右夺冠几率而已。
根据高盛的预测,除了巴西队之外,最可能夺冠的球队分别是阿根廷、德国和西班牙,他们分别有14.1%、11.4%和9.8%的夺冠概率。
值得一提的是,为了尽可能将预测维持在理性分析的范畴内,高盛并未考虑单个球员对比赛造成的影响,比如德国队穆勒一到世界杯就爆发,或者阿根廷的梅西的国家队进球运势不畅,还有裁判倾向等等,这些不可量化的影响因素统统都会被排除在考虑之外。这样当然会让模拟过程更简单容易,不过,其预测效用也就会大打折扣了。
事实上,四年前南非世界杯的时候,高盛就曾经预测过一次,其结果不算太离谱,但也有一些很失准的地方。比如说,他们当时预测巴西队夺冠几率最高,西班牙次之,结果是西班牙夺冠;另外,他们还认为意大利小组出线概率达到84.8%,法国队也能有76.0%的把握出线,但这两支球队分别在所在小组垫底,不得不在小组赛结束后就打道回府。如果用R平方系统来评估他们的预测准确度,你会发现,高盛在2010年的预测R平方值只有0.24,距离完美的1(100%准确度)还有相当遥远的距离。