作者 | 陈文琦
万万没想到,2022年一开年的资本盛宴是由“它们”点燃的。
先是杭州李未可科技有限公司宣布已完成数千万元天使轮融资,由字节跳动独家投资;随后,核心技术为快速动画技术和实时数字人技术的世优科技完成千万级A+轮第一期投资。
一个月前,虚拟数字人及虚拟时尚研发商世悦星承则是完成了网易领投的千万元天使轮融资;而“虚拟人”生态公司次世文化在过去一年时间里一共完成了三轮融资。
集原美、AYAYI、柳夜熙、翎_Ling、A-SOUL、韬斯曼、aespa、华智冰、崔筱盼、希加加……虚拟人已经毫无疑问地走进了我们的现实世界。据头豹研究院数据,当前虚拟数字人市场规模已超过2000亿元,预计这个数字到2030年将达到2703亿元。
不过,热闹归热闹,虚拟人发展至今究竟有哪些进步?商业化价值又在何处?未来将如何发展?还有哪些不为人知的隐忧?这一系列问题或许才是各色虚拟人背后需要关注的核心。
来龙去脉
虚拟人不是一夜之间生成的。
硬要追溯的话,恐怕要回忆到1982年日本动画《超时空要塞》中的女主角林明美。当时林明美被制作方包装成演唱动画插曲的歌手,并制作了音乐专辑,成为了世界上第一个虚拟歌姬。
此后,虚拟人伴随着CG技术、动作捕捉技术、语音合成技术等等技术的发展,不断进化——从二次元虚拟歌姬初音未来、洛天依的出现,到现在各类型虚拟数字人被批量生产,虚拟人有了很明显的飞跃:
- 从人物设计上说,现在更多的虚拟形象外形多是超写实、高保真,他们不仅在形象上与真人相似度极高,行为上也愈发贴近真人。
- 技术层面进步,无论是虚拟人的智能化程度,还是动作的流畅自然程度都大幅上升。按技术分类,也分为智能驱动型和真人驱动型(通过真人动作捕捉完成动作)。
- 从实用性角度考虑,虚拟人拓宽了可行的应用场景,有高度工具化的服务型虚拟人,如虚拟主播、虚拟员工,也有对标艺人、偶像、网红的IP型虚拟人。
百度智能云AI人机交互实验室负责人李士岩认为,数字人产业有三大核心推动力,第一级火箭是用户需求与技术升级、第二级是政策支持与资本涌入、第三级是计算平台的迭代。
以目前的情况来看,三级火箭都处于相对早期、正在加热的阶段。在过去若干年的时间里,虚拟人的价值空间并未打开,直到去年元宇宙概念的火爆,才将虚拟人推至台前,也让虚拟人背后的复杂产业链浮出水面。
腾讯字节百度等大厂、虚拟人垂直赛道初创公司、技术提供商、影视制作公司、MCN、IP策划运营公司......都试图在这场盛宴里占得一席之地。而虚拟人产业链上下游环节、角色众多,因此对应着的机遇与挑战也很不一样。
虚拟人的“上游”主要是虚拟人底层技术提供方,包括显示设备、光学器件、传感器、芯片等硬件制造商,建模软件、渲染引擎等软件制造商,专门化的AI厂商、XR厂商、CG厂商、自研虚拟人技术的垂直厂商。腾讯、百度等综合性的互联网大厂也有很强的技术输出能力。
“中游”的主要玩家是IP策划和运营公司,完成虚拟人的IP孵化、形象设计、运营经纪等工作。虚拟人产品分为IP类和非IP类,前者是艺人型的,后者服务型,更注重实用性。分类方式和维度较多,或按应用场景分,或按技术能力分、或按外形分。国盛证券研报将其分成服务型虚拟人(PGC+功能型)、虚拟偶像(PGC+IP价值)、数字化身(UGC+功能型)、创作载体(UGC+IP价值)。
“下游”则是场景的应用,不同应用场景对应着不同需求的客户,覆盖泛娱乐行业、消费品以及金融、文旅、教育、医疗等行业。
结合“上中下游”,不难推导出创造一个虚拟人的要素:实际应用场景倒推出虚拟人的特征,再协同“内容”与“技术”,将这些需求落地。
但目前,虚拟人产业链各个节点相对割裂,行业中的大部分公司都只是涉猎虚拟人全流程中的某个环节,因此很难协同调优。同时,服务型虚拟人和演艺型虚拟人各自为阵,个性化和规模化都很难做出突破,也暴露了虚拟人生产效率问题。
创造虚拟人
任何技术在早期阶段总是伴随着试错、迭代、不断的投入。虚拟人也是如此,一个不那么完美的虚拟人,其实造价不菲。
比如“会捉妖的美妆达人”柳夜熙,10月份上线至今发布了6条视频,抖音粉丝量为834.5万。据其背后公司创壹科技CEO梁子康透露:“2018、2019年,我们每一秒视频价格比1克黄金还贵,现在每一秒价格相当于2到3克的黄金制作水准和制作成本,其核心是建立壁垒。”
虽然他在采访中表示,其实柳夜熙的人物创作周期不长,做片子花了不到两个月,但是前期投入了巨大的研发、人员成本,幕后内容团队超过100人。建模、制作、渲染所需的软硬件设备、人员团队……虚拟人可以说是一只吞金兽。
另一位虚拟人行业从业者告诉「真探」,柳夜熙团队出一条片子,“如果没有100万的制作费,根本出不来,如果低于这个费用,片子的质量会令人吐槽。”
这也就是说,超写实虚拟人视频每秒的成本超万元。
业务覆盖虚拟人策划设计、制作集成以及内容运营的虚拟人垂直厂商雪爪科技的商业化负责人林雁也表示了投入的巨大。她告诉「真探」,虽然公司目前可以做到全链路多数环节的覆盖,但是前期投入很大。
比如雪爪建成一个300m²左右的动作捕捉场地,需要配备超过40台肢体捕捉设备、还有脸部表情捕捉设备、以及动捕服、摄像机、电视机等,整体造价超过200万元。
时间上来说,随着制作流程化,一个虚拟形象的制作的时间周期已经压缩,但是从原画、模型制作、骨骼绑定到调整,整体流程需要6-8周。“每个公司对于数字人的产能也是有限的。” 林雁说。
雪爪按形象,将虚拟人分类为超写实、2.5次元、2次元、Q版/萌宠,不同精度虚拟人的制作成本差距巨大。
Q版形象从制作到执行,整个制作周期大概只有一个月,但是一个超写实虚拟人则需要更长时间。
林雁告诉「真探」其有一款尚未上市的虚拟偶像,团队调整了近8个月,“她一根头发丝的细腻程度的调整和渲染所耗费的时间是一个二次元形象全部的时间”。
虚拟人的前途与隐忧
虽然虚拟人生产、运营成本高,但是随着虚拟人应用场景越来越广泛,受众群体不断拓展,需求端的热情给予产业上的公司诸多掘金的机会。
除了IP型虚拟人,随着NPL(自然语言处理)、XNR(深度神经网络渲染技术)等AI技术的成熟,越来越多的服务型虚拟人也在具体行业中找到了自己的明确位置。
新近的案例有小冰公司公布的每日经济新闻主播、万科数字化员工“崔筱盼”,前者能够不间断播报资讯,面容、形态与真人无异,后者在系统算法加持下可以提醒应收/逾期以及侦测工作异常。
与IP类虚拟人相比,此类虚拟人实现的技术条件和应用场景有明显不同。
首先,在形象生成上,这两款虚拟人都没有单纯使用昂贵的CG技术,而是利用XNR技术,通过深度学习,在大量数据中提取特征,加快传统的渲染流程。从观众直观感受来说,相比超写实虚拟人,虚拟主播形象更近似于真人。除了形象,核心能力还有朗读、播报、专业化的金融资讯撰写、财经摘要能力等等。
小冰公司COO徐元春告诉「真探」,其实小冰和每经的合作从2019年就开始了,主要集中于做金融资讯。2019年末,双方进行了一次深入交流,思考AI技术还能做什么。当时的初步预想是,做一个“对标”彭博的财经电视,可以全天候播报金融资讯。但是当时的技术条件并不能实现,人和声音需要自然、真实,整个系统整合需要完成实时视频推送,中间穿插的视频内容也要由技术生成。
直到去年年末,虚拟主播才正式上线。其背后是小冰积年累月的技术投入,甚至难以量化。
百度在2019年也发布过一款虚拟数字人小浦,与浦发银行、虚拟人技术公司原力动画合作,应用于金融客服领域。去年,腾讯游戏NExT Studios与新华社媒体融合生产技术与系统国家重点实验室共同打造了一位数字航天员小诤,面向载人航天工程、行星探测工程等中国航天重大项目开展新闻报道。科大讯飞推出AI虚拟主播解决方案,结合语音识别、语义理解、语音合成、虚拟形象驱动等技术。
整体来看,服务型虚拟人大多针对产业数字化的需求,其商业模式与SaaS有一定的相似之处。
现在的收费模式是标准化能力模块选配,“按雇佣人的逻辑去收费”。结合场景需求,客户从小冰技术栈中选择模块,组成套餐,并且可以随着需求的变化调整或升级模块选择。
“现在能看到在某些具体场景,大家选择的套餐越来越趋同,这也证明这就是真实的使用场景。”徐元春说。
据徐元春介绍,小冰有能力完整的技术栈,在自然语音理解、计算机语音、计算机视觉、人工智能内容生成等方面都有所积累,提供的是完整的技术框架,随着各种与行业标杆企业合作案例的落地,对行业的专业认知和技术的复用性也在增强。“比如现在另一个电视台也想做一个24小时财经电视,我们要解决是重新训练一个主播,这个过程现在只需要一周。”
对演艺型虚拟人的需求也在爆发,相对于服务型虚拟人,他们拥有更多“个性”、“人设”。不过不用担心,虚拟人的“人设”完全受控制,不会塌房。
但不同于服务型虚拟人对于虚拟人背后专业素质的精准要求。演艺型虚拟人市场更加“混乱”,质量良莠不齐,优劣差异化明显,技术、内容跟不上概念,加上高居不下的生产成本,商业化并不容易。
由于很多技术的重合性,很多影视特效公司进入虚拟人领域,比如港股上市的视觉特效制作公司数字王国。在2022年江苏卫视跨年演唱会上,数字王国用高阶渲染技术重现了“邓丽君”,与歌手周深合唱。受益于元宇宙概念的拉升作用,数字王国股价在年初连续上涨一周。
影视特效行业本质上做的是定制服务,在产业链中对上游的议价能力弱,而且人力成本高。一部大片的成功通常少不了优质的视觉效果,但特效制作公司却不在票房分红的名单里。顶级特效公司破产的情况屡见不鲜,比如《少年PI的奇幻漂流》背后的R&H。
对于影视特效公司而言,切入虚拟人领域无疑是一个好机会,但若这套在影视工业中不占优势的商业模式不改变,恐怕也很难从中谋利。
另一类非常活跃的是垂直虚拟人厂商和经纪运营类公司,比如创壹科技、燃麦科技、次世文化、雪爪科技等。
虚拟IP的收益主要来自于演出、代言、直播电商等,按商业化类型分,也有两种类型:一、先有独立IP再拓展场景;二、根据客户需求场景定制产品。
雪爪目前与天猫、花西子、卡姿兰、认养一头牛、百联、万科等都进行过不同方式的合作,据林雁说,由于品牌/平台客户需求差异,合作方式会有所不同,有长短期的代言人、但是公司推动的大多是年框的合作,量级在百万以上,在一年中,基于虚拟人形象,结合营销节点,提供服务内容。
行业处于上升期,“相比我们的前期投入,盈利还是微乎其微,但我们比较看好未来状态”,林雁表示。她认为,目前还是教育品牌、教育市场的阶段,很多时间、费用、使用方面的问题,客户并不清晰,也是他们使用虚拟人之前最大的顾虑,但是随着尝鲜的品牌越来越多,收益效果明显,她对行业持有乐观态度。
现在市场上虚拟人形象众多,但是同质化严重,打造独特的IP价值需要强大的运营能力。头部IP能赚钱,但是缺少稳定粉丝群体、个性不鲜明的中腰部虚拟人身价不高。
以一张“神级证件照”在小红书走红的银发少女AYAYI,第一张Po图获得10万+点赞量,但是近期10张新图平均点赞量只有181;“造价不菲”的柳夜熙从去年10月上线抖音至今,也只有5个视频和1组图文内容,内容储备少,公司后续推出另一个虚拟人热度一般。多数的虚拟人辨识度不高,过目即忘,昙花一现。
爆款难做,更难持续。
若虚拟人只停留在一个完美的形象,这终究不可持续,更重要的是背后各种技术的协同集成,以及其作为一个内容载体能传递表达的信息。
徐元春在与「真探」的对话中,不愿意将如万科员工崔筱盼这样的角色定义为「服务型」,他希望小冰的虚拟人是更有人性温度的,而非仅仅为了完成流程性工作设置的一个环节。“所以我们称他们为AI Beings,叫他们为虚拟人是因为这是一个打了引号的人。”他说。
虚拟人赛道尚在起步阶段,随着行业发展、技术成熟、制作成本降低,“它们”与“我们”的互动或许只是未来中再正常不过的事。