来源:村田
发布时间:2025-3-21
阅读量:3
聊聊AI系列为您介绍过什么是生成式人工智能(Generative AI)。体育现场直播和解说正在成为生成式人工智能非常有趣的一个应用场景。
随着人工智能技术的不断发展,它已经广泛而深入地融入人类生活和商业活动的方方面面,并开始对人类社会产生深远的影响,尤其是在那些高度依赖人力的复杂业务领域,这种影响尤为显著。生成式人工智能的应用范围正在快速扩张,其发展趋势尤为引人注目。
具体来看,生成式AI的应用领域正在以那些需要人工精准应对的业务为核心,逐步向更广泛的场景拓展。此外,由于其能够通过学习大量数据来形成准确判断的能力,它在许多依赖个人经验和专业技能的领域得到了广泛应用。例如,生成式AI已经在体育领域实现了实用化,并逐步扩展到更多相关场景。
图一 人工智能在体育领域的应用也在稳步扩大。
01、AI为体育领域带来新的价值
体育直播的播音员和评论员在众多的职业当中可以说是专业性特别强的职业种类。例如,电视上解说棒球比赛的人大多数都是前职业选手。能够担任这些职种的人数有限。因此,电视等大众媒体不得不将直播对象集中在观众人数较多的竞技、比赛和选手表现上。
通过将生成式人工智能等前沿人工智能应用到体育直播这样的典型特别业务中来产生新价值的趋势越来越明显,比如为残疾人提供现场解说服务;覆盖小众观众的关注,让每一个人都可以选择自己喜欢和关注的参赛选手;以及更加细致的技术解说等等。
图二 需要高度专业化的解说能力和播音能力的体育现场直播也在逐步实现人工智能化。
02、AI直播:关注每一位参赛选手
在直播高尔夫比赛时,会跟随受到关注的选手所在组进行的比赛,并在其他组打出精彩击球时切换到其他组。但是,可能也有很多观众想要关注与正在播放的选手不同,无法看到自己喜欢的选手所在小组的比赛,或者只想挑选他们自己不擅长的近距离击球观看,或者只想观看困难球击球。这些观看需求虽然人数较少,但如果将这些小众需求集中到一起,占观众总数的比例可能会大到出乎意料。
2023年和2024年,海外某场高尔夫比赛使用生成式人工智能提供了一项服务,该服务自动生成视频片段,为每一位参赛选手和每个洞的每次击球提供现场解直播和解说。
图三 对全体选手、全部的洞和全部击球自动进行现场直播和解说的人工智能服务。
这次比赛提供的服务可以说是切实满足小众需求的服务,例如使用对过去直播选手的技能进行学习后的生成式人工智能,将通常不会直播的场景也作为对象进行自动解说等。但是,如果让人进行现场直播和解说,就需要更多的人手,因此无法满足这些少数群体的要求。在比赛中,很多组同时进行比赛,几乎不可能全部配备所需的人才,即使配备了,也需要花费大量的成本和精力。在这种情况下,使用生成式人工智能可以产生显著效果。
在提供的现场实况直播服务中,利用经过学习并已能基于选手的击球数据,自动生成穿插高尔夫术语的旁白的人工智能自动生成了2万多个视频剪辑。当时使用的生成式人工智能能够生成具有多种句子结构和词汇的旁白,并用自然语言创建有吸引力的剪辑,能够从包含大量信息的文章中尽可能地删除没有意义的部分。
在2024年赛事举办时提供的服务中,进一步添加了每个洞的选手比赛预估功能。包括17万多次的击球在内,使用8年的比赛数据和球场上的球位置数据等对人工智能模型进行训练,使其可以预估选手在整个比赛中每个洞的得分。
在进行预估时,先反映每个洞已完成比赛的每位选手的新表现,然后更新每个洞的预估结果。根据数据对每个选手十分值得关注的洞,以及全体选手的最低和最高分数等进行预估。在2024年赛事举办时已经能在解说中进行“预计9号洞将成为今天第3难的洞”等基于过去和目前的表现数据对各个洞的击打状况进行的预估,以及“从统计学上来说,从这个位置击球有82%的几率会成为小鸟球”等与各个洞的击打内容相关的统计性洞察。此外,不仅可以提供英语旁白,还可以同时提供西班牙语旁白。
03、帮助残疾人观看体育比赛
现在还出现了一种动向,即创建一种机制来利用前沿的人工智能,以特定的个人为对象,提供个性化的现场直播和解说。人们已经开发出了向观众席上有视觉障碍的人士实时解说赛道上发生的赛车比赛情景的技术。
图四 通过人工智能进行的现场直播让残障人士也能一起欣赏比赛。
在引擎轰鸣声回荡的赛道上进行的比赛中,前来观看比赛的人员可以体验到只有在现场才能体验到的冲击力。然而,有视觉障碍的人士无法理解眼前发生的事情,可能根本无法愉快地享受这种体验。即使与朋友或家人一起去观看比赛,也表示自己对不得不让别人对比赛状况逐一说明感到抱歉,并且因为无法参与周围热火朝天的活动中而感到不合群。不仅如此,他们甚至会感受到车子开得太快时听到突如其来的爆炸声后的恐怖。尽管这是一个让很多人聚集在一起体验兴奋的空间,但对于残疾人来说,这只不过是一个痛苦的地方。通过使用人工智能进行实时现场直播,实际参与演示实验的视障人士已经可以一起欣赏比赛。
该人工智能系统由“物体识别”、“征兆检测”、“语音框架”三个不同角色的人工智能组合而成,各个人工智能相互联动,实现实时现场直播。用于物体识别的人工智能可以根据固定摄像头拍摄的视频识别赛车。可以掌握比赛状况,例如图像中的赛车是哪支车队的赛车以及哪些选手正在相互角逐。第2个是用于检测征兆的人工智能,它对实时收集的单圈时间和排名等数据进行解析。寻找比赛中发生变化的“征兆”,例如何时以及谁可能超越前面的车辆。语音框架人工智能学习现场直播播音员过去的比赛现场直播解说,生成自然、真实的现场直播解说。
04、向体育之外的领域扩展
利用人工智能进行的体育自动现场直播和解说技术,正展现出广泛的应用潜力,不仅局限于体育领域,还可能拓展到更多场景。
体育领域的应用
儿童运动会直播:AI技术可以轻松实现儿童运动会的现场直播,为家长和观众提供便捷的观赛体验。
训练指导与智能球童:AI能够通过视频分析运动员的训练过程,提供准确的技术指导。此外,智能球童功能也正在开发中,有望为运动员提供实时的辅助。
个性化解说:AI解说系统可以根据观众的兴趣和偏好,提供个性化的解说内容,甚至支持多语言解说,满足不同观众的需求。
其他领域的应用
教育领域:AI技术可以应用于烹饪培训,通过视频捕捉烹饪过程并提供改进建议,从而提高烹饪效率和熟练度。
零售服务:在零售店中,AI可以通过观察顾客的面部表情和小动作,识别他们的需求并提供个性化的商品推荐和细致的服务。
过去,小众和个性化的体育解说服务往往需要经验丰富的专业人士来提供,成本较高且难以普及。然而,随着AI技术的发展,未来有望在更多样化的环境中,为更多人提供高质量的服务。