回到主页

数字代言人的
适用场景

Jason Wod

· 经济与人口观察

我们未来的社会角色或许会被简化成三种主要类别:资本大鳄、演绎明星和蓝领工人。资本大鳄控制着财富的流动,拥有最大的决策权和影响力;演绎明星利用自己的独特才华和魅力吸引关注和资源;而蓝领工人则是执行具体任务的主体,他们在新的社会结构中占据着基础的劳动力位置。这三种角色的分化,将进一步加剧社会的不平等,但也为我们提供了一个新的视角来看待未来的社会构成。不同角色的需求和追求将驱动整个社会的发展方向。
——Kevin Kelly 《Out of Control》 第十六章:人类的终极命运,1994年

1. 数字人技术简述

虚拟数字人,指存在于信息世界中,由计算机图形学、自然语言处理,人工智能,深度学习等手段创造,并具有多种人类特征的综合产物。它兼具“虚拟”,“数字”“人”的三大特征,以电讯号和无机物作为载体,存在于信息世界当中,并不能在真实空间中实现五感六意。依托多项数字化技术而存在,随着相关技术的逐步成熟,而推动发展;具备多方面高度拟人化的外表和交互形式。

随着信息采集技术与输入技术的高度发展,特别是高精度小型化的传感器、物联网技术、动作捕捉技术,海量的已经形成的数据内容以及大型数据库的建设,灵活的视觉识别及语音,文字识别能力让数字人的理解能力都变得异常强大。不仅如此,数字人在内容理解及形成层面,加持了NLP技术和CV技术,结合神经网络模型和深度学习技术,再加上强大的算力,使得计算机在对内容的理解和新内容的生成能力上也变得遥不可及,并且随着信息输出和能力构成的增强,使结果的输出从传统的文本、语音输出,实现了二维图像、三维模型,再到VR/AR方式的呈现。人类机械制造能力的增强,甚至使我们有条件使用人形机器人作为信息和能力输出的载体。

美国著名学者,丹尼尔·丹尼特,在《直觉泵和其它思考工具》一书中提到真实世界与虚拟世界的边界问题。他认为,二者最核心的区别之一,在于真实世界的绝对噪音和虚拟世界的绝对寂静。在真实的世界中,雷霆雨露、四季交叠,复杂的外部环境本就存在,而要让处于虚拟世界的计算机理解这种复杂的外部环境,则需要大量精确的输入。这种真实世界与虚拟世界之间是存在着本质的不同的,也是更多国内的传播过程中,人们愿意将其描述为“次元壁”的原因。

但无论如何数字人在替代真人,模态升级,虚拟IP和形成第二身份这些领域,已经开始逐渐产生大量的应用成果。

broken image

2.数字代言人的两大应用场景

在数字代言人的应用上,虚拟数字人可分为代替真人服务的服务型和用于娱乐/社交的身份型。两者的核心功能、产出定位、代表应用、产业价值均明显不同。服务型虚拟数字人主要用于替代真人提供服务,需要具备一定的功能性,能够提供相应的服务,主要的产业价值来自于降低已有的服务业的产业成本,为存量市场降本增效。而身份性虚拟数字人主要用于娱乐/社交的功能,需要具备明显的身份性,要么直接成为虚拟IP/偶像,要么具有虚拟世界中知名的身份。主要的产业价值来自于成为人的交互中心。

在量子位发布的《虚拟数字人白皮书》中提到,“经过测算,我们认为,在2030年,我国虚拟数字人整体市场规模将达到2700亿。其中,得益于虚拟IP的巨大潜力,以及虚拟第二分身的起步,身份型虚拟数字人将占据主导地位,约1750亿,并逐步成为Metaverse中的重要一环。 服务型虚拟数字人则相对稳定发展,多模态AI助手仍有待进一步发展,多种对话式服务升级至虚拟数字人形态,总规模超过950亿。”

broken image

从现状来看,已经得到应用的数字代言人的主流变现模式,一种是嵌入通用服务当中,如小爱同学的数字人形象等。另一种是打造一个全新的IP出来,例如韩国SM公司推出的新女团Aespa,一半成员包含虚拟偶像。

3.数字代言案例

在国内动漫与虚拟偶像领域,洛天依作为典型代表以全新虚拟IP模式塑造了自己的独特形象,其成功经验在这一领域中已经有了显著的影响。2012年7月12日,洛天依声库正式推出,标志着她在中国国际动漫游戏博览会上的首次亮相。起初,她主要活跃在动漫二次元圈内,当时虚拟数字人物与传统动漫角色的界限尚不明晰,行业技术和内容都在不断探索中。直到2016年后,随着她逐渐走向大众视野,洛天依开始成为业界的瞩目焦点。

2015年3月21日,洛天依与言和合唱的《普通DISCO》一曲在bilibili上的巨大成功,成为首支中文VOCALOID神曲,播放量超过1758万次(截至2022年11月3日)。此后,她在各大舞台上频频亮相,包括2016年在湖南卫视春晚与杨钰莹同台演唱《花儿纳吉》,以及为电影《忍者神龟2:破影而出》演唱主题曲等。

洛天依的形象和影响力在接下来的几年内持续扩大,她不仅以全息形式出现在Bilibili Macro Link并演唱《66CCFF》,还与许嵩、付辛博等艺人合作,频频参与各类重要演出和活动。例如,2017年在上海梅赛德斯-奔驰文化中心举行的万人演唱会,以及多次参加的跨年晚会和文化盛典。

2018年以来,洛天依继续扩展她的表演领域,参与《经典咏流传第一季》与王佩瑜合唱,《奋斗的青春最美丽——2020年五四青年节特别节目》中合唱《少年》,以及参加各大年度音乐盛典和晚会,不断巩固她在行业内的地位和声誉。

2022年,洛天依更是成为首位登上奥运舞台的中国虚拟歌手,表演的《time to shine》受到广泛关注,彰显了她在文化和艺术交流中的突出地位。

洛天依的成功不仅仅来自于她丰富成熟的形象和强大的粉丝基础,更因为她在虚拟偶像领域中不断探索和创新的精神,为行业发展开辟了新的可能性。

broken image


4.数字代言人案例的启发

我们从上述的和一些我们研究过程中识别到的代言人案例中发现,数字代言人领域存在的广泛特征是,海量部署,快速发展,频繁迭代。所谓海量部署,是指数字人一旦开发成功,其部署速度之快,规模之庞大,足以引人侧目。所谓快速发展,是指该领域技术的快速发展,使得成本快速下降,可以支持的服务模态也迅速增多。所谓频繁迭代,是指神经网络和深度学习模型带来的黑箱问题依旧没有很好的解决,或者仍旧需要我们投入大量的成本通过RAG或者微调优化,因此为其实际投入应用也制造了一定的障碍。

但是不可否认的是,数字代言人依旧具备一些重大的优势。如果人的工作超量,那就叫“牛马”,但如果数字人的工作超量,那只能叫“电费暴增”。硅基劳动力可能最终真的会成为解决碳基劳动力人口倒三角结构的核心解决手段。

为什么我们这么说呢?因为金无足赤,人无完人;但数字人由于其处于“绝对寂静”的背景环境特征,因此不用担心人设崩塌,不存在一般明星的塌房风险。其次,有一个非常关键的优势,那就是数字人具有明确的权属,当我们把业务的归属从“人”指向“数字人”的同时,实际也将“人权”转向了“物权”,因此彻底解决了跳槽飞单等问题。最后,数字人是不知疲倦的,不管是信息的吸收(输入)还是信息的发布(输出),都可以用多对一,一对多的形式呈现,效率都会得到极大提升。

而数字代言人的劣势,我们也不能满目掩饰。衔阶段来看,数字人还存在形象拟真度不够,难以真正提供情绪价值,以及在大规模应用的过程中,面对的立法与边界问题。特别是,数字人在没有完全解决黑箱与幻觉问题之前,是否能够被更广泛的用户群体认可,这不仅是个技术难题,也是个技术悖论。假如我们设计数字人的初衷是为了精确的控制,那么为了精确的模仿,我们在单一数字人形象上的投入会远超一般人的想象,那么数字人的总量就会非常有限。假如我们想摆脱递归算法的影响,那么为程序加入大量随机数,它会更像真正的人类一样成长。但是,既然像人了,就必然会犯错,如果他犯错了,谁来承担这个结果呢?

对于上述的问题,你们怎么看?欢迎留言与我们交流~