前言:这两年,足球数据在国内得到了重视,可数据知识的普及面不够,间接造成了写手们的滥用;在头条这个平台,多少人为了拿奖,用数据来堆砌、填充文章......趁着中超尚未开赛,还是想用近五年从事足球数据工作的经验,和大家聊一聊。
我想说,肤浅的数据统计,永远无法充分解释比赛的复杂性。
以总数、平均值、百分比等形式呈现的数据,和足球赛本身具有差不多长的历史。它代表着对比赛过程的粗略描述,是赛事年鉴中的突出条目。然而对于将其作为通用语的观众和记录员来说,个人数据却已发展到喧宾夺主的地步。它背离了浓缩球员贡献的本意,摇身一变成为衡量其价值的权威标准。
数据只是参考,评价球员还需要掌握具体的比赛背景
这是一种不靠谱的精确:赛场上激动人心的表演被迫沦为缺乏背景的数字。而许多现实因素是无法计量的,其中既包括场面局势、判罚警告等客观有形因素,也包括美观、冲劲、灵感、优雅、决心、领导力、镇定、性格等主观无形因素。尽管这些因素往往令足球运动充满浪漫色彩,涌现出大跌眼镜的表演和流芳百世的传奇球星,但悲哀之处在于人们关注的焦点还是数据。
总体而言,在将团体运动的定性行为转化成定量数据的过程中,有两条信息被滤掉了。第一条信息比较重要,即事件的影响力。简单来说,一切进球、积分和连胜都不是被平等创造的,其价值由于三样因素的存在有所区分:一是某个进球对某场比赛的影响(是否关键球),二是某场比赛在赛事全局中的重要性(是否焦点战),三是被进球一方的实力水平(是否为强敌)。
想想这该多么符合实际情况。进球是足球运动的硬通货,是每场比赛最纯朴的胜负手。虽然每粒进球都被平等地统计,其重要性却不尽相同:补时阶段打破僵局的绝杀非同凡响,其意义远胜过锦上添花或者崩盘情况下的安慰球。