Related Articles
Related Jobs
数据量化分析和统计师的工作非常吃香,在体育博彩业内,该职位的薪资水平(年薪)在5万美元到75万英镑之间。在银行业和对冲基金行业内,在算上年终奖之后,类似职业的薪资水平更加丰厚。
数据统计分析在事件预测上应用广泛,比如自然灾害以及其发生频率。对这类事件进行建模后,可以预测事件最有可能的结果和将事件的影响减至最小的方法。2014年节礼日的印度洋海啸就是一个无法预测的事件,因此灾难发生后举世震惊,但是其他的一些自然灾害却可以通过数据统计建模来进行预测。
保险公司必须对他们所受理业务的风险性有一定了解,比如低风险的房屋担保应该包括户主可能会遭受的盗窃或火灾。风险度相当高的房屋担保包括对户主的房产每年所受气候影响的损坏进行理赔,比如在加勒比海或者墨西哥海湾等地带。投资银行依赖于风险模型,通过对以前每一支股票的回报率来建立最完善的资产组合。资产组合理论是建立在资产内股票之间的关联性上,并且其目标是创造在已知风险度(资产波动)上获得最大回报率的资产组合。风险模型的建立是基于某个资产组合内资产的年利率,这是通过资产内每一支股票和其他所有股票之间的关联性来得到的。
蒙特卡罗方法(统计模拟法)经常被用来对导致某一事件的多种因素来进行建模。每一种因素都能被进行适当的加权后来反映出它对最终结果的影响度。蒙特卡罗模型十分复杂,在建模过程中需要用当许多随机变量。一个非常简单的例子是运用蒙特卡罗方法来估测圆周率的值,假设在坐标轴上存在半径为1的单位圆,该单位圆存在以原点为中心的正方形内,我们能通过电脑随机生成两个0到1之间的数,看这两个实数为横纵坐标的点是否在单位圆内。然后统计落在单位圆内的点数和总点数来进行圆周率估算(单位圆的面积和正方形面积之比为pi:4),当随即点取得越多时,其结果越接近于圆周率的值。
蒙特卡罗估算法不仅仅运用在对金融风险的建模上,在物理学里,它的作用也相当之大。比如在用蒙特卡罗估算法来进行对无定形(非晶态)固体在激光冲击下放射衰变时的状态密度分析。
对足球比赛来说,没有必要对每一场比赛的结果进行高准确度的预测,而是应该通过每一支球队以往的赛绩来预测一个可能性最高的结果。数据量化分析师目前在招聘市场上供不应求,预测比赛最有可能出现的结果可以针对那些赌比赛输赢的彩民来更准确的设定赔率。
多年以来,David Spiegelhalter教授和他在剑桥大学的数据统计团队对以往的足球比赛结果经行了研究,同时也对未来的赛事走向做了一定的分析。在研究中,他们统计出到目前为止每个赛季的平均进球数,然后用每支球队的总进球数除以赛季平均进球数,这样可以看到联赛里一流球队的进球比会高于那些垫底球队的进球比。
他们同时也计算出了球队主客场的平均进球数,因此,每一支球队都会有相应的攻击强度比(总进球数/平均进球数)和防守易伤率(丢球数/平均进球数)。与此同时,基于球队的主客场胜负结果,每一支球队都会有一个相应权数,这个权数是由每支球队主客场的进球平均数来决定的。
在《不确定性的理解:疯狂的足球》一文中有一个很好的例子,David Spiegelhalter教授的剑桥团队通过对赫尔城与曼联的比赛进行分析。
2008到2009赛季的主客场进球平均数分别是1.36与1.06。曼联的攻击强度是1.46,而赫尔城的防守易伤为1.37;相对的,赫尔城的攻击强度为0.78而曼联的防守易伤为0.52。
因此,曼联的期望进球数可以通过1.06 x 1.46 x 1.37 = 2.12来计算得出。同样,赫尔城的期望进球数为1.36 x 0.78 x 0.52 = 0.55。
另外,通过二元泊松分布可以对影响比赛结果的附加因素加以讨论。进球数2.12只是一个计算的进球平均数,为了得到曼联在比赛中的实际进球,我们将2.12这个数作为泊松分布的平均数。通过计算,实际的期望进球数为2个(有趣的是2球之后的下一个可能性是一球,而曼联在那场比赛中正好只进了一球)。
随着庄家从彩民的下注中大量获利,体育博彩行业也随之蓬勃发展。与其他生意一样,庄家们需要通过获得市场优势来使所获得的利益最大化。为了达到这个目的,博彩公司情愿为数据量化分析师开出10万英镑的年薪。一个称职的量化分析师需要有数据统计建模方面的商务经验和对足球的热爱,通常这些精英们都拥有数学或物理学的学位,当然有博士的头衔的分析师们将是这些公司的最理想人选。