百度在奥运期间搞了一场人机大战
如何不再忍受一个你不喜欢的球赛解说员?除了换台和静音,现在有了新的方式——用机器淘汰他。 比起人来说,机器没有情感偏向,几乎不会出现低级错误,比如把赞助商SHARP当作球员名字进行介绍,也不会因为把握不好节奏漏掉关键的比赛细节,对于历史数据和信息,甚至没有人能击败它,因为它所拥有的是无限的资料库和迅速搜索分析的能力,而人只能凭借大脑和记忆。 用机器实时解说比赛,这是人工智能和机器学习的场景性应用之一。在这个过程中可以训练机器对于实时场景信息的处理、分析、解读和判断能力。而且如果对于一场高速进行的球赛都能实时解说,那这种机器的模型和能力就还能应用到更多场景和情况中。 百度版“人机大战” 出于上述考虑,百度度秘研发团队正在训练旗下人工智能机器人助理——度秘,解说奥运男子篮球赛,而且为了让这种解说更富挑战性和交互性,度秘团队请来了拥有多年篮球解说经验的杨毅,他将和度秘同场搭档解说。这是百度版的“人机大战”。 篮球解说员杨毅在解说直播间,他的搭档将是面前的机器 不同以往,这次别开生面的人机解说带有协作性质,但也充满挑战意味。机器和人的差异,可以在赛前、赛中和暂停休息等三个不同场景中被明显感受到。 在赛前,对于两队各自情况和数据记录,度秘表现出了机器所具备的“博学性”和准确性,它准确调取了球员信息、历史对战数据等。而这部分工作以前往往是人类解说员的“功课”,不少解说员需要赛前花费大量时间搜索、归纳和整理。 杨毅的解说则只能更加偏向人文性和趣味性,带有较强的主观感性。比如介绍立陶宛时,他能够介绍到立陶宛知名的啦啦队美女,以及如何在立陶宛叫到一扎啤酒。类似这样的知识,度秘或许也知道,但它很难主动告诉你,除非在个性化训练和调校中,它知道你对这些方面的知识感兴趣——它会在后台通过“标签”给用户描绘画像。 比赛中,度秘则开始展现实时解说比赛的能力,“谁,什么状态,在做什么事情,最后结果如何”,这些比赛基本要素它能够表述清楚,现场体验来看,相当于在通过收音机观看比赛。实际上,图文版也在同步进行中,但完全是机器自发的行为,不用再耗费任何人力。而此时,杨毅的作用则是带来围绕某个状态和场景延伸开去的信息,并且丰富解说氛围。打比方来说,杨毅和度秘在整个比赛过程中相当于在进行一场相声表演:杨毅是插科打诨的捧哏,度秘则是不断围绕主线进行阐述的逗哏。 而在中场休息时间,度秘则带来总结分析,比如数据统计方面,或者更加个性化的数据情况,如某个球员的具体数据等。这些数据此前依赖于赛会组织方面的统计,只有赛会方面统计完毕才能分发到解说员,但现在,机器可以在解说的同时完成这部分工作,并在实时比赛间隙播报。如果你是一位“教练”型的观众,那通过机器带来的数据能够更加清晰地掌握比赛走势——此前则有赖于解说员的个人风格,毕竟不是每一个解说员都爱在休息时间用数据分析比赛。 此外,如果你是一位爱听段子的球迷,机器也能从评论中抓取有趣的评论或人气较高的评论进行“解说”。 机器解说的背后原理 从技术原理的角度来说,度秘目前可以实现的“解说”能力主要基于自然语言处理技术(NLP)。简单来讲,这个处理过程和技术大致可以分为:对需求信息分析理解、获取基本信息(包括对文字和图片的信息的搜集、分析和理解)、实现智能化输出和有风格的解说。 其实这个过程也包含了目前人工智能领域的几大核心技术:语音识别、大数据计算和机器学习。 但赛事解说的特殊性在于它比语音识别更加复杂,也比一般的聊天互动需要更高的智能化程度,因为解说需要基于领域知识,面向不同层次、需求的用户,理解比赛当时的形势,用自然、流畅、生动的人类语言讲解出来。 自动解说主要从机器翻译技术上找到灵感,基于统计和机器学习方法,把基本的统计数据翻译成有趣的人类语言解说。为了实现这种“有趣”和解说风格,度秘学习了NBA和2012伦敦奥运会篮球赛的几百场比赛文字解说,不仅讲人话,还学到了风趣幽默、表情包的运用等。 比如在解说某个球员投篮打框未命中时,度秘的表述是:“XXX上篮,咣当,仿佛听到打铁的声音。”另外,在给大家介绍奥运会篮球比赛三分线和NBA三分线规制的不同时,它如此说道:“奥运会比赛三分线XX米,NBA三分线XX米,不过还有一种三分线叫库里。”这就是机器学习了人类解说资料的结果。 为什么是篮球解说? 对于此次选择从篮球比赛解说入手的原因,新浪科技也询问了百度大搜索总产品架构师景鲲,得到的解答是度秘团队认为篮球比赛场景更加丰富、进行速度更快、交互更加频繁,对于机器学习和训练更加有挑战,此外,篮球比赛受众范围更广,在国内关注程度高,可以获得更多更及时的用户反馈。当然,另外一个隐秘的原因是度秘团队中有不少工程师是篮球爱好者。 度秘此前单独解说中美篮球赛 不过,除了篮球比赛,机器解说可能在足球比赛中会更加受到欢迎。因为足球比赛场景要比篮球比赛少,但是涉及的数据和知识又会更多。所以在数据方面,机器解说会超越任何解说员的“活字典”般的记忆;其次是对于场面的分析,结合数据会更加有针对性的分析。 实际上,这一定程度上也能帮助球队教练做决策,比如通过机器解说掌握的数据情况,不断分析球员状态和场面因素,能够帮助教练实现及时调整。 其实,将科技运用于比赛训练和执教并不稀奇,目前世界上最为优秀的足球教练之一魔力鸟穆里尼奥就一直通过iPad和应用帮助自己分析比赛,及时作出关键决策和判断。 不过对于度秘团队来说,通过机器解说球赛的方式训练,目的并不是简单代替“解说员”,他们希望通过这样场景化的机器学习训练,未来可以将模型和方法应用到更多更广泛的场景中。“比如北京大雨天气会造成露面积水,那度秘可以对各方面信息和数据做出综合判断和分析,引导避开积水路段。”百度度秘&多模交互搜索部总监孙雯玉介绍说。 当然,度秘团队的“野心”是最终能打造出一款“我的度秘”,它能够全知全能,给用户生活、工作提供更多的个性化帮助,更加便利和智能。但目前来讲,技术上尚无法实现这种“全知全能”,对于发布即将满一周年的度秘,度秘团队希望在今年内推出的2.0版本会有更多场景化和个性化上的丰富。 机器会让解说员失业吗? 如果把机器解说放到更宽泛的人工智能进展中来看,那也可看做是机器对于人类活动和能力的一种替代。在让实时翻译员、财报编辑和速记等“失业”后,度秘之类的机器程序正在让部分“解说员”下岗。 拿目前人工智能业界的论调来说,这些被替代的工作里,很大一部分是“简单的重复的脑力劳动”。相比于工业革命对体力劳动的解放,目前汹涌而来的人工智能革命正是奔着解放部分脑力劳动去的。 机器在资料收集和分析方面具备优势 不过不必担心的是,人工智能固然有计算方面的天然优势,但具体到解说这种领域,机器也肯定不会完全取代人类。比如机器再如何学习、“吃”了多少解说资料,都必然不会在比赛中灵光乍现,脱口而出“他继承了意大利左后卫的光荣传统,这一刻他不是说一个人在战斗,他不是一个人!”之类的激情解说。 这样的时刻有些类似人机围棋大战里,李世石击败AlphaGo的那一局中的“神之一手”。归根结底,人类所具有的感性和灵感的那部分,机器尚不能习得,也无从学起。 然而有意思的是,如果完全通过机器来解说比赛,那解说界再也不用担心被批评“不中立”,也不用在比赛中不断被球迷吐槽了。不知道这是否意味着在解救一部分不堪忍受糟糕解说的球迷的同时,也让观看比赛少了吐槽解说的乐趣。 但另一个更有意思的事情是,如果未来某天AlphaGo真的要来中国挑战柯洁,那这次就可以实现双重人机大战了。一方面是机器和棋手下棋,另一方面是机器和人在解说分析上较劲。 当然,这时的你也能用机器助手叫个外卖小龙虾之类的。 |
关键词: |