在媒体深度融合的背景下,主流视听媒体积极拥抱数字人技术,围绕视听播报、虚拟偶像、智能客服等场景推进应用创新,部分示范应用已经达到了全球领先水平。主流视听媒体虚拟数字人运营须透彻理解智能身体作为新型媒介的底层价值,充分发挥技术赋能,注入情感设计,探索确立商业模式,同时要警惕数字人发展的潜在风险。本文刊发于《中国电视》2023年第1期。
文丨徐琦
责编丨闫伟
概念厘定:何为虚拟数字人
技术支撑:人工智能驱动数字人升级迭代
传媒实践:聚焦虚拟主持人推进应用创新
(一)整体态势:积极拥抱数字人技术,示范应用全球领先
(二)典型场景:聚焦视听播报,探索虚拟偶像、智能客服等
从功能维度来划分,虚拟数字人的应用场景主要覆盖偶像娱乐、专业服务和情感陪伴三大方向,具体形态包括虚拟偶像、虚拟主播、虚拟客服、虚拟助手、虚拟导游、虚拟讲解员等。对于主流视听媒体机构而言,其虚拟数字人应用场景当前以视听播报专业服务为主,同时也在积极拓展虚拟偶像、客户服务等多元化场景。
首先,该类应用有助于满足视听新媒体内容生产提效需求。当前领先的数字人平台数字人数据采集与建模的周期和成本已显著降低,传媒机构得以快速定制和部署数字人方案。利用智能驱动的TTSA人物模型,媒体编辑只需输入播报文本,就可直接将其转换为虚拟主播实时播报视频,使视听播报内容常态化生产的门槛大为降低。例如,新华社“AI合成主播超市”成员在新媒体端可支持用户自定义选择的常态化内容播报;每经AI电视台的“N小黑”“N小白”已可实现金融资讯内容的不间断播报。
其次,该类应用有助于满足视听新媒体内容样态创新需求。尤其在重大活动报道、重点节目中,主流视听媒体利用数字人技术推出虚拟小编、虚拟记者、虚拟文化推广人等示范创新应用,极大促进了内容创新。例如,新华社数字宇航员、数字记者“小铮”成功承担了载人航天工程、行星探测工程、探月工程等国家重大航天项目的“现场报道”任务;央视网人工智能编辑部“小C”连续两年担纲全国两会特别策划直播节目主持人,流畅完成与多位全国人大代表直播连线的高难度采访任务。
情感陪伴场景下,数字人主要承担类似私人助理、私人顾问、虚拟亲友等情感陪伴类功能,但由于此类应用场景对于技术、策划、运营等各方面要求较高,目前主流视听媒体在该方向的探索尚不深入。
(三)技术赋能:技术能力与路线各不同,以合作研发为主
针对不同的业务场景,主流视听媒体数字人应用技术能力要求与实现路线也不尽相同。视听播报场景中的虚拟主持人并不具备交互能力,节目形态多以单向播报为主。在人工智能技术赋能下,这类应用已经实现了多语言、方言、手语播报以及一键换妆、换装、场景切换等功能。直播采访场景对虚拟主持人的交互能力要求很高,为保障内容安全,在直播过程中还需要在AI驱动与人工接管之间无缝切换。虚拟偶像场景对交互性和全身动作要求更高,目前仍以真人驱动为主,将捕捉采集的真人动作迁移至数字人是其动作生成的主要方式。例如,上海广播电视台“申雅”就是通过实时光学式动作捕捉技术和增强现实跟踪系统实现的。
研发方面,由于数字人严重依赖人工智能技术积累,主流视听媒体多采用与领先人工智能企业合作的方式来推出虚拟数字人项目,自研比例相对较低。其中,人工智能企业提供技术支持,主流视听媒体提供业务落地场景,并开展持续运营。
优化策略:发掘智能身体传播的潜能
(一)理解智能身体传播,发掘场景价值
未来数字人不仅是智能身体传播的中介或信息,更有望在强人工智能的赋能下成为传播的主体,其将推动主流视听媒体打破单一的“媒介域”而走向多域整合,⑤高效助力融媒体内容生产创新转型,更有望作为云宇宙的入口,有力推动主流视听媒体改变自身在信息传播格局中的被动地位,⑥与其他主体站在同一起跑线上参与元宇宙多维、跨维信息传播格局构建,其发展潜力与价值无可限量。
具体来看,数字人的价值是不同应用场景中对人的价值的数字化虚拟仿真。随着数字人智能化程度与情感化设计水平的提升,传媒数字人的应用场景和价值将得到极大拓展。事实上,当前主流视听媒体数字人应用场景非常局限,仍以虚拟主持人替代真人主持人进行新闻内容播报为主。这一方面是由于技术要求与商用成本相对较低,后期运营投入较为轻量,另一方面是因为这类场景中的信息价值大于数字人作为信息媒介的价值,数字人只是“工具人”。未来,数字人还有望在表演、歌舞、直播、社交等“表演人”场景中担当主角,发挥出数字人本身作为信息的价值;以及在教育、咨询等“专业人”场景中,发挥数字人作为服务的重要作用。
(二)用好人工智能成果,注入情感设计
美国学者唐纳德·诺曼在《情感化设计》中指出,情感和情绪在日常产品设计和传播中起着关键作用,并提出了情感化设计的三个层次:本能层、行为层和反思层。⑦本能层是用户对产品视觉和第一印象的本能直接反应,本能层先于思考和逻辑判断。行为层是用户与产品在行为上产生的交互关系,具备一定的理性和逻辑感。反思层是产品的独特内涵、品牌差异性在用户心中根植的独有记忆,用户会因为这份记忆经常触发情感共鸣,从而忠实于产品。
虚拟数字人要超越“工具人”的价值定位,必须具备交互能力和共情能力,因此利用智能技术提升情感设计是关键,即通过数字人行为、认知、感官和功能的可供性的共同作用来不断满足“情感三层次”诉求。⑧
具体来看,在本能层,重点是增强数字人的吸引力,提升用户的感官层体验,具体可以通过相貌、气质、着装等设计优化以及不断提高仿真模拟能力来实现。在行为层,核心在于人机交互能力,基于语音识别、语音合成、自然语言理解等打造数字人“能听、能懂、能说”的智能人机交互体验,从而提升数字人作为自然人机交互界面的价值。在反思层,重点是打造共情力,即在用户与数字人交互过程中感知情感与引发共情的能力,一方面通过情感计算来赋予数字人识别、理解、表达和适应人类情感的能力,提高人机交互的亲切性和准确性,另一方面要通过塑造人设、打造知名度、跨界合作等持续运营来不断赋予数字人以个性、才华、价值观以及复杂“人性”,从而获得用户的共情、认可与信任。
(三)探索多元商业模式,增强造血功能
商业模式尚不明晰是当前主流视听媒体数字人应用的痛点之一。加之现阶段虚拟数字人的开发成本、终端成本与体验成本依然相对高昂,尤其是高仿真、超写实、AI驱动类数字人研发成本居高不下,这也让数字人商业变现问题显得异常突出。
构建可信身份认证,保障内容安全
国内主流视听媒体在积极拥抱虚拟数字人发展的同时,也必须要高度警惕技术滥用带来的内容安全隐患与潜在社会风险。具体来看,用于深度合成AI主播的技术同样可用于“深度伪造”各国政要、公众人物甚至任何一个真实人物,倘若被恶意用于国家之间的政治抹黑、军事欺骗甚至恐怖主义行动,或者被用于非自愿色情、色情报复、诋毁诽谤、身份伪造、诈骗、经济犯罪、虚假信息传播等情形,都将给社会各界带来难以估量的巨大风险与负面影响。
传媒领域数字人应用更为特殊,一旦出现失误,或者被人恶意操控,势必会引发信息传播业公共性侵蚀、新闻真实性与客观性消解、社会信任破坏等重大社会问题。为此,主流视听媒体须始终保持警惕与人文反思,重视内容鉴别技术、溯源追踪技术研发,前瞻性构建数字人可信数字身份认证体系,有力保障内容安全,引导传媒领域数字人应用始终向上向善发展。
(作者系中国传媒大学“媒体融合与传播”国家重点实验室新媒体研究院副研究员,本文受北京高校高精尖学科建设项目中国传媒大学“互联网信息”学科专项资金资助。)