量化挑战

Rob Esteva将与我们探讨收集有用数据时会遇到的挑战、如何将它应用于职业足球博彩及体育运动本身。

Categories: 工具, 所有体育赛事, 数据, 职业级

Related Jobs

在我整个职业生涯中,我几乎都在与体育数据打交道,最近我讨论的话题更多地集中于职业足球和体育博彩中的数据收集及随后之使用。

上周我在彩民休息室读到一篇挺有意思的文章,内容是在分析比赛和球队的时候,交易者会使用哪些统计数据。文中并没有花笔墨介绍交易者使用哪些类型的网站,这倒是完全可以理解的。在欧洲获得足球赛的数据可没有在北美拿到各主要体育运动数据般容易。访问任何主要联赛(NHL,NBA,MLB,MLS,NFL)的网站,你会发现数据多得令人难以置信,等待着被应用,尤其是用于建模,北美的这一做法由来已久。但足球可不一样,Opta之类的网站是近几年才兴起的。

然而,我认为数据收集缺少两个基本条件,且同样的原则适用于投注,也适用于职业足球。

质高于量

从每场比赛的10000个数据中寻找有用的数据是具有挑战性的。即使大量数据唾手可得,找到赛事和有意义的统计数据其实也不是件容易事。防御行动更是出了名的难以看出名堂。世界上一些最好的防守球员拦截和解围的统计数据实际上可能比其他人要低很多,因为他们的定位、预测和沟通可能会比其他人更好,但谁能收集或量化这些技能的数据呢?颠峰时期的里奥·费迪南德就是一个很好的例子。同样,一些防御统计数据也有误导性。当读到有关某个后卫的100%解围成功率的报道时,我感到一丝难堪。一次成功的解围通常被认为是清除危险,后卫经常会100%解围。比赛中,重要的是不成功的解围和失误的防守的比率,而非35次成功的解围。

在足球运动中量化“质量”是一个挑战。让我们试试量化射门射正的情况。射门可以是30码外的远射,这对门将几乎没有威胁,命中率最小。对比射门射偏,很多数据提供商会把球击中门框、门将根本没有摸到球的情况算在内。射球击中角旗也被归在此类。击中门框和其它两种射门尝试之间存在巨大差异,但在阐释每种射门质量上却没有显示其差别的好方法。

再一步分析一组稍明显的数据,依然存在漏洞。你可能有球员起脚射门位置的坐标,但却不知道他是从什么位置开始有射门的念头的。从18码处面对一个密集防守的罚球区射门,或进攻球员只面对门将而没有其他球员防守,这两种情况是存在很大差别的。同样地,没有数据用来记录一个球员用了多少时间完成一次射门,或者一个后卫逼抢得多紧。

主观数据这时候就要发挥作用了。许多数据提供商在采集数据时会惊异于主观性。你基本上会要求所有的数据收集和分析人员对所有的比赛思考方式和标准相同。但我可以向你保证,这不是一件容易的事,所需要的训练是比较严格的。如果收集的数据是正确的,从这样的数据中获得的启发则是非常宝贵的,对于体彩交易者想要了解球员或球队的真正价值也好,或者俱乐部试图发掘一个可签约的新球员,评估自己的球员或分析的对手也好,都能提供一定的帮助。

与许多其他体育项目相比,足球的目标相对小些,要了解一个球队质量的第二步是其制造或错失的机会。这需分析对进球机会的把握并按质量分类。分析各种情况,试着理解一个进球的概率,如果此类情况会发生一百万次,这对设置标准会有帮助。25%到50%的命中率(一个好机会,能让对方门将下准判断不用防守的射门)或高于50%的命中率(一个极佳的机会,可能是射丢了一个球,或是被对方门将一个指尖拖出门框,或是单刀直入射中球门),是衡量球队和球员的表现的另一个宝贵的指标。这可比克里斯史密斯(Chris Smith)在他优秀的TSR博客中提及的传统的射正射偏理念要更有远见。另一个需考虑的方面是这样的“好机会”或“极佳的机会”是在一场比赛中制造出来的。我认为,与在比赛进行到88分钟被灌进第五粒球相比,双方最终比分为0比0的情况下出现极佳机会的几率更高一些。真实、公允地评价一个球队的实力对于在市场中寻找价值来说是最基本的,而以质量为基础,洞察力为驱动的数据可以帮你做到这些。

心理角逐

另一个缺失的核心基础,并且也是很难量化的,是球员和球队的心理因素。这完全是同样的原则,如果作为交易者,你能预测一个球队的比赛动机,你很可能会有一个更准确的投注数量。如果你是一个足球经纪人(我们都参与了比赛或至少在酒吧里跟聊天的朋友这么说),如果你能识别某球员有更高的动机或对守门员更专注,你转会和选择球队的成功率可能会更高。

一旦到了3月,在一些比赛中的动机因素将变得非常重要。每到赛季的这个时候,谁将争取联赛冠军,谁将晋级或保持在欧洲赛场的地位,谁有危险被降级,将没有任何悬念。这时,那些表现不尽人意的球队就会出现动机不强问题或水准忽高忽低。任何能准确预测这个周末哪支队能从纽卡斯尔一站出线的人都应该得到一枚奖牌。

把握趋势、研究球队形势可以对彩民的操作有极大的好处。信心和士气是需要研究的另一个重要因素。富勒姆队(Fulham)本赛季被灌了40个球是有原因的。在他们21次失利中有16场是输了超过2个球。当在比赛中领先或打平的时候,他们的斗志和前进的动机是合理的。但当他们落后的时候,他们就垂头丧气,这在本季非常明显,上周末对曼城的比赛更是如此。因此,他们并不是那种你想为之赌上一切的球队。

分析这些的趋势和表现可以对彩民操作产生不同效果。心理学家可能会不赞同,但即使在不同的比赛情况下对球队的动机和信心水平进行简单的评分,也可以帮助预测他们接下来的表现。这可能不会消除纽卡斯尔比赛的不可预测性,但会帮助找到表现出色的球队。本赛季的英超联赛在西布罗姆维奇的比赛最多(13场)。西布朗队在最后的七次平局中都是在先失球的基础上反击而扳平比赛。他们在保级战中饱受煎熬,可能会排在第十六位,这使我更确信地预测他们比纽卡斯尔队或富勒姆队在比赛落后的情况下表现得更好。西布朗队会在我给英超球队的动机排位中排名较好。

在市场上寻找价值是困难的。现今博彩公司对定价牢牢把握,即使早期市场脱节,价格空间也往往很小且很快又恢复有序受控状态,投注规模使得大玩家不会过早出手。过去在比赛开球之前出价似乎是错误的操作,现在反而是一个受过教育、拥有大量的研究资料的交易者惯用的手法。7-10年前,有很多钱在市场上流动但是缺乏利用率,这使得找到真正的价值很容易。

现今,一个交易者如没有各种主要的资源的话很难成功。然而,这也绝非不可能。寻找策略和创意是成功的关键。创建你自己的评分机制,使用主观数据来给球队排位,或者尝试去量化出困难因素,例如动机,然后进行测试。现在很少有捷径可走,但也不要被挑战吓退哟!

 

About Rob Esteva

Rob Esteva is a Director at Onside Analysis & Stratagem Technologies Ltd and co-founder of www.statplat.com. Previously of Smartodds and UEFA, Rob specialises in Sports Data and Analysis.
No Thoughts on 量化挑战

Leave A Comment