当足球遇上信息论:球队“群体智慧”是如何涌现的?
当足球遇上信息论:球队“群体智慧”是如何涌现的?
团队动态对现代足球比赛的结果有着显著影响。本研究采用信息理论方法,特别是因果涌现理论,并结合图论,利用 34 场日本职业足球联赛(J 联赛)的追踪数据,探究球队层面的动态变化如何从球员间的复杂互动中产生。我们重点关注集体行为如何从个体行动的相互依存关系中产生,通过球员的位置和移动来考察球队的协调性和动力学,以识别涌现的特性。具体来说,我们选择了相对距离到球场中心、质心(CoM)以及基于速度相似性和反距离的聚类系数作为宏观特征,以捕捉球队结构、协调性和空间关系的关键方面。相对距离和质心代表球队的整体位置,而聚类系数则提供了球员之间局部合作和移动相似性的见解。
在现代足球比赛中,团队协作的复杂性远不止个体能力的简单叠加。传统分析方法往往聚焦于球员的跑动距离、传球次数等单一指标,但这些指标难以解释球队队员间“精密仪器般”的默契配合。最新发表于Entropy的一项研究,首次将因果涌现理论(causal emergence)与图论结合,通过J联赛34场比赛的追踪数据,揭示了球队动态中隐藏的“群体智慧密码”。
从微观混乱到宏观秩序:信息论如何量化团队协作?
研究团队提出一个核心问题:“球队的整体行为如何从球员的个体互动中涌现?”,他们从球员的位置、速度等微观数据出发,提取了四类宏观特征:
- 相对场心距离(relative distance):全队位置与球场中心的平均距离,反映攻防整体阵型。
- 质心坐标(CoM, center of mass):全队位置的几何中心,捕捉空间协同趋势。
- 速度相似性聚类系数(clustering coefficient by velocity):基于球员运动方向与速度的局部协同度。
- 逆距离聚类系数(clustering coefficient by inverse distance):球员间距的紧密程度。
研究使用Rosas等人提出的部分信息分解(PID)的框架,通过信息论将多个变量之间的信息分解为特有信息(unique),冗余信息(redundant)和协同信息(synergy)。通过因果涌现值()计算,研究者比较了宏观特征与微观个体行为的预测能力差异:若>0,说明团队行为存在“1+1>2”的协同效应;<0则表明个体冗余动作主导。
图 1. 足球队动态中的宏观特征选择和因果出现分析框架。(a) 从微观特征生成宏观特征。(b) 基于CoM的宏观特征图示,它是由球员位置这一微观特征得到的;CoM到场地中心的距离,它是从球员位置生成的微观特征;速度相似性的聚类系数,它是由球员的速度这一微观特征得到;以及反向距离,它是从球员位置这一微观特征得到的。红点和蓝点表示不同队伍球员的位置,线条表示两个物体之间的距离。(c) 因果涌现分析。
控球率的秘密:空间秩序比速度同步更重要
研究发现,基于空间位置的宏观特征(相对距离、CoM)与控球率高度相关(R=0.79)。例如,当球队控球时,球员会自发形成“蜂窝状”空间网络,通过质心前压创造传球三角区。这种涌现的秩序让对手难以通过盯防单点瓦解进攻。
图 2. 基于聚合后的位置指标和控球率的因果涌现差异的相关性。(a) 基于相对距离计算的因果涌现与控球率呈现较高的相关性,相关系数为 R = 0.79 ( p < 0.001 )。(b) 基于CoM的因果涌现与控球率显示出类似的强相关,相关系数为 R = 0.74 ( p < 0.001 )。
反观速度相似性聚类系数,其与控球率几乎无关(R=0.06)。这意味着,球员高速冲刺的局部同步(如边路快攻)虽具观赏性,却未必能转化为持续控球优势。文章中给出了生动的比喻:“这就像蜂群虽会短暂聚散,但维持蜂巢结构的稳定性才是生存关键。”
图 3. 基于网络互动度量与控球率的因果涌现差异的相关性。(a) 基于反向距离的聚类系数计算的因果涌现值与控球率之间相关性呈中等强度,相关系数为 R = 0.58 ( p < 0.01 )。(b) 基于速度相似性聚类系数计算的因果涌现与控球率之间的相关性接近于零,相关系数为 R = 0.06 ( p = 0.71 )。
进攻vs防守:因果涌现揭示战术本质
在射门前60秒的关键阶段,进攻方因果涌现值持续上升,尤其在最后10秒飙升。这表明,成功进攻依赖球员位置的动态协同重组,而非个人突破。例如,某次进球前,攻击方质心突然向禁区弧顶收缩,诱导防守阵型失衡,随即边后卫插上完成传中。
防守方的因果涌现值规律则截然不同:因果涌现值随时间递减,说明防守更依赖“冗余动作”,例如多人协防封堵同一路线。这种策略虽能短期维稳,却可能因过度协同丧失应变弹性。
图 4. 在投篮前60秒内,(a) 相对距离和 (b) CoM 作为宏观特征的因果出现。每个数据点代表使用60秒时间间隔计算的因果出现,时间间隔结束于测量时刻。阴影区域表示所有事件中每个数据点的均值标准误差(SEM)。蓝线表示投篮队伍(进攻队伍)的数值,而橙线表示对方队伍(防守队伍)的数值。灰线表示在随机选择的60秒时间间隔内的平均因果出现值,这些时间间隔的数量与实际投篮事件相匹配。此数据提供了投篮事件前的动态与中立或随机比赛阶段之间的基线比较。图表上方的彩色带表示组间的统计学显著差异,采用了Bonferroni校正来进行多重比较。绿色带表示进攻队(蓝线)与防守队(橙线)之间的显著差异。蓝色带表示进攻队(蓝线)与随机时间间隔(灰线)之间的显著差异。橙色带表示防守队(橙线)与随机时间间隔(灰线)之间的显著差异。
教练与球迷的新视角:从“盯人”到“控场”
这项研究为足球战术分析提供了全新工具:通过实时监测因果涌现值,可评估阵型调整是否提升团队协同水平,帮助优化球队日常训练;还可以用于对手表现分析,若某队速度聚类系数突增但因果涌现值低,可能预示对方采用了依赖“单点爆破”战术。正如论文所指出:“足球不仅是22人的奔跑,更是微观互动编织的宏观艺术。”因果涌现理论为我们一步步解开球队战术黑箱,我们或许离解码足球的“终极美感”又近了一步。
本文原文来自Entropy杂志,由北京师范大学系统科学学院张江教授、清华大学计算机科学学院崔鹏副教授,以及瑞典卡罗琳斯卡医学院高级研究员 Hector Zenil 合作在 Entropy 杂志发起的 Causality and Complex Systems 特刊。
论文信息:
- 期刊:Entropy
- 栏目:复杂性特刊
- 主题:因果与复杂系统(Causality and Complex Systems)
- 论文题目:Information-Theoretical Analysis of Team Dynamics in Football Matches
- 发表时间:2025年2月21日
- 论文地址:https://www.mdpi.com/1099-4300/27/3/224