完全改变体育现场直播和解说的生成式人工智能技术
完全改变体育现场直播和解说的生成式人工智能技术
生成式人工智能支持的未来社会
完全改变体育现场直播和解说的生成式人工智能技术
2024年11月15日
在视频分发服务上看到的实际视频其实是使用人工智能(AI)创建的虚拟视频。这样的体验已经不再罕见。
人工智能在我们不知不觉中普遍深入地应用于人类生活和商业的时代已经到来。进化成高阶且通用的技术的生成式人工智能已经达到了实用水平,被用于我们更熟悉的应用。如今,包括生成式人工智能在内的人工智能应用已经扩展到了体育领域。在此,我们将以在现场直播领域的应用为中心,对人工智能应用的动向及其影响进行相关解说。
人工智能在体育领域的应用也在稳步扩大
人工智能应用对于依赖人力的高阶业务更加有效
迄今为止,使用计算机的信息处理技术已经使许多作业和业务的效率变得更高。其结果是带来了影响力大到能够改变人类生活和社会活动的冲击。
包括应用范围目前正在不断扩大的生成式人工智能在内,高阶人工智能技术的应用对象已经出现了与过去的信息处理技术不同的倾向。首先,它的应用范围正在以需要人工进行准确应对的业务和作业为中心不断扩大。以前,总体上来说,信息处理技术还是更多地应用于单纯作业的自动化。然而,人工智能给人的感觉是在需要高度专业知识、技能和诀窍的高阶作业和业务中的应用反而正在不断增加。此外,由于它能通过学习数据来获得做出适当判断的能力,因此往往被用于许多依赖于需要经验支持的个人能力的作业和业务。
需要高度专业化的解说能力和播音能力的体育现场直播也在逐步实现人工智能化
体育直播的播音员和评论员在众多的职业当中可以说是专业性特别强的职业种类。例如,电视上解说棒球比赛的人大多数都是前职业选手。能够担任这些职种的人数有限。因此,电视等大众媒体不得不将直播对象集中在观众人数较多的竞技、比赛和选手表现上。通过将生成式人工智能等前沿人工智能应用到体育直播这样的典型特别业务中来产生新价值的趋势越来越明显。
对未被电视直播的关注选手和关注击球进行现场直播和解说
2023年和2024年,海外某场高尔夫比赛使用生成式人工智能提供了一项服务,该服务自动生成视频片段,为每一位参赛选手和每个洞的每次击球提供现场解直播和解说。
在直播高尔夫比赛时,会跟随受到关注的选手所在组进行的比赛,并在其他组打出精彩击球时切换到其他组。但是,可能也有很多观众想要关注与正在播放的选手不同但自己喜欢的选手所在小组的比赛,或者只想挑选他们自己不擅长的近距离击球观看,或者只想观看困难球击球。这些观看需求虽然人数较少,但如果将这些小众需求集中到一起,占观众总数的比例可能会大到出乎意料。
这次比赛提供的服务可以说是切实满足小众需求的服务,例如使用对过去直播选手的技能进行学习后的生成式人工智能,将通常不会直播的场景也作为对象进行自动解说等。但是,如果让人进行现场直播和解说,就需要更多的人手,因此无法满足这些少数群体的要求。在比赛中,很多组同时进行比赛,几乎不可能全部配备所需的人才,即使配备了,也需要花费大量的成本和精力。在这种情况下,使用生成式人工智能可以产生显著效果。
对全体选手、全部的洞和全部击球自动进行现场直播和解说的人工智能服务示意图
在提供的现场实况直播服务中,利用经过学习并已能基于选手的击球数据,自动生成穿插高尔夫术语的旁白的人工智能自动生成了2万多个视频剪辑。当时使用的生成式人工智能能够生成具有多种句子结构和词汇的旁白,并用自然语言创建有吸引力的剪辑,能够从包含大量信息的文章中尽可能地删除没有意义的部分。
在2024年赛事举办时提供的服务中,进一步添加了每个洞的选手比赛预估功能。包括17万多次的击球在内,使用8年的比赛数据和球场上的球位置数据等对人工智能模型进行训练,使其可以预估选手在整个比赛中每个洞的得分。
在进行预估时,先反映每个洞已完成比赛的每位选手的新表现,然后更新每个洞的预估结果。根据数据对每个选手十分值得关注的洞,以及全体选手的最低和最高分数等进行预估。在2024年赛事举办时已经能在解说中进行“预计9号洞将成为今天第3难的洞”等基于过去和目前的表现数据对各个洞的击打状况进行的预估,以及“从统计学上来说,从这个位置击球有82%的几率会成为小鸟球”等与各个洞的击打内容相关的统计性洞察。此外,不仅可以提供英语旁白,还可以同时提供西班牙语旁白。
支持残疾人和健全人一起观看体育比赛
此外,现在还出现了一种动向,即创建一种机制来利用前沿的人工智能,以特定的个人为对象,提供个性化的现场直播和解说。人们已经开发出了向观众席上有视觉障碍的人士实时解说赛道上发生的赛车比赛情景的技术。
在引擎轰鸣声回荡的赛道上进行的比赛中,前来观看比赛的人员可以体验到只有在现场才能体验到的冲击力。然而,有视觉障碍的人士无法理解眼前发生的事情,可能完全无法愉快地享受这种体验。即使与朋友或家人一起去观看比赛,也表示自己对不得不让别人对比赛状况逐一说明感到抱歉,并且因为无法参与周围热火朝天的活动中而感到不合群。不仅如此,他们甚至会感受到车子开得太快时听到突如其来的爆炸声后的恐怖。尽管这是一个让很多人聚集在一起体验兴奋的空间,但对于残疾人来说,这只不过是一个痛苦的地方。通过使用人工智能进行实时现场直播,实际参与演示实验的视障人士已经可以一起欣赏比赛。
通过人工智能进行的现场直播让残障人士也能一起欣赏比赛
该人工智能系统由“物体识别”、“征兆检测”、“语音框架”三个不同角色的人工智能组合而成,各个人工智能相互联动,实现实时现场直播。用于物体识别的人工智能可以根据固定摄像头拍摄的视频识别赛车。可以掌握比赛状况,例如图像中的赛车是哪支车队的赛车以及哪些选手正在相互角逐。第2个是用于检测征兆的人工智能,它对实时收集的单圈时间和排名等数据进行解析。寻找比赛中发生变化的“征兆”,例如何时以及谁可能超越前面的车辆。语音框架人工智能学习现场直播播音员过去的比赛现场直播解说,生成自然、真实的现场直播解说。
人工智能自动化技术向体育之外的领域扩展的潜力
利用人工智能进行的体育自动现场直播和解说技术有可能应用到多种领域。容易想到的一个例子可能是提供儿童运动会的现场直播等。此外,由于除了现场直播外,还可以提供解说,因此,观看训练并提供准确指导的人工智能和人工智能球童等估计也会实现。
此外,除了体育之外,还可以用于提高教育和服务提供等的质量。例如,提供烹饪培训,通过视频捕捉烹饪过程,并提出改进建议,使烹饪效率更高并更加熟练;在零售店为顾客提供服务时,观察顾客的面部表情和小姿势,识别他们想要的商品和服务并先提出与此相关的建议,提供细致的“接待”,这些就属于此类应用。
迄今为止,这种热情好客的服务只能由经验丰富的人提供。因此,获得足够服务的人不多。在不久的将来,通过利用人工智能,或许能够在更加多样化的环境中为更多的人提供同样高质量的服务。