澎湃Logo
下载客户端

登录

  • +1

巨头造“人”,一场AI较量

2022-07-10 08:46
来源:澎湃新闻·澎湃号·湃客
字号

AI既是数字人的基础,也决定了数字人能力的天花板。

作者/静秋

出品/新摘商业评论

“百度世界大会的一大看点正是火出圈、成顶流的数字人。”

7月6日,百度世界大会预沟通会上,百度高级副总裁袁佛玉着重介绍了当下数字人的发展情况。

让人印象深刻的是在信息密集、节奏紧凑的预沟通会中,主持人度晓晓始终应对自如,其间“她”还向百度高级副总裁袁佛玉问了一个关于自己的问题。而在刚刚过去的6月,度晓晓用40秒钟时间完成了40篇高考全国卷的命题作文,惊艳众人。就在今天,度晓晓还将直播挑战上海高考英语作文。

眼下不止是百度在打造数字人,包括阿里、网易、腾讯、字节、华为等都推出了类似产品。巨头下场造“人”不单是具有打造IP的能力,从某种意义上讲,数字人是衡量科技企业技术集成与整合能力的标尺。

一位业内人士认为:“科技公司以IP的方式,全方位呈现各自能力,这背后其实是各自生态展示肌肉的表现形式。”

一、数字人“缠斗”

巨大的市场潜力,是巨头批量制造数字人的直接原因。

日前,IDC发布的报告显示,中国AI数字人市场规模呈现高速增长趋势,预计到2026年将达102.4亿元人民币。而巨头推出各种各样的数字人,看似杂乱无章,实际皆有深层次的考量。

腾讯数字人的基底是建立在语音智能和大文娱生态上的。语音智能方面,根据语义匹配对应动作、字词的能力,是腾讯数字人在技术上的底色。此外,微信上的实时语音转换与翻译,所产生的海量数据,使得其语音会话能力能够经过翻译和转化而持续生长。

推动腾讯发布数字人的动因是巩固大文娱生态。“云小微数智人平台”由播报数智人平台与交互数智人平台两个系统组成。对应的落地场景为手语主播、数字导游、数字客服、虚拟IP偶像等虚拟资产。

同样身处文娱市场的字节跳动,虽然在IP与版权资源上的积累有限,但是通过连续不断地投资与人才引入,一个AI+XR的软硬协同生态正日益明显。

塑造IP较为成功的还有阿里,其曾借着冬奥会,推出了自己的数字人“冬冬”,展示其肌肉。透过冬冬可以发现,由于AI实时驱动,数字人说话的同时,能协调嘴形、表情、动作,乃至模拟真实环境下的部分场景。而且采用了面向高质量图形的Unity高清渲染管线(HDRP),因此在视觉上有着不输AR/VR的效果。

阿里数字人早已开始直播带货,用AI“平替”主播。从逻辑上讲,数字人带货能够解决真人带货的种种局限和各类不可预测的风险。

AI驱动是百度的数字人的最大特点,靠着硬实力,截至目前打造了多个不同面向的IP,如度晓晓、希加加、文夭夭,覆盖了功能型与演艺型两个大类。

百度AI数字人度晓晓

度晓晓和文夭夭创造了功能型数字人的两个范式。前者能力全面,后者则主要面向垂直领域。度晓晓不单是一个CG或者问答环节的数字人,而是能够胜任各类创意型工作,能够作文、作词、作曲、作画,开辟了一个AIGC的内容生产模式。文夭夭为数字人运营细分领域,打开了市场,通过AI技术为文博领域提供新玩法。

演艺型数字人希加加,早前在集度汽车发布会上亮相,一度惊艳业内,百度也成为业内率先尝试在会展领域引入数字人的巨头。

百度AI数字人希加加

看得出或许是由于寻求技术突破的周期长、难度高,现下大部分厂商皆围绕自身长处,推出数字人。

像网易林幺幺通过接入AI算法,主要应用到电商带货中。科大讯飞,虽然没有腾讯、网易、阿里那样强大的图像处理能力,但是从“冰冰”与“加加”两个虚拟IP来看,其核心还是输出科大讯飞的语音交互能力。

二、百度整“花活儿”

不难发现,时下的数字人更像是一个载体,要么搭载内容与场景,要么搭载各类技术,正是因为这个原因,巨头们才不遗余力造“人”。

在梳理之中我们也能看到,无论是知识库与交互,还是算法与建模,AI都扮演了举足轻重的角色,不过分地说,数字人的竞争本质上其实是AI能力的竞争。

而百度可以在短短两年多时间内接连推出度晓晓、希加加、文夭夭等特点、功能、使用场景截然不同的数字人IP,表明“AI路线”的潜能。

在今天的百度世界大会预沟通会上,百度高级副总裁袁佛玉提到,百度AI驱动的数字人的不同在于“可交互”性,而且还具备创作能力。

把时间回拨到2020年,那年百度世界大会上,度晓晓被定义为“智能助理”而首度问世,彼时,人们只是感受到了AI原来并非那么冷冰冰,而是可以有温度,这颠覆了传统认知中,技术都是冷冰冰的陈见。

“智能助理”的定位意味着百度需要持续解决人的各类需求,全方位应对信息输入、处理、输出的挑战。仅仅通过营销方式制造IP,让市场接受数字人,似乎有些追本逐末。事实上,随着入局玩家、搭载场景的增加,以及竞争走向激烈,市场走过新奇阶段时,技术能力将起到决定性作用。

数字人为百度提供了AI技术落地的场景之一。之所以度晓晓们能够有极强的互动性,与之沟通更丝滑,主要原因在于由文心大模型、AI超写实建模所构成的AI内核。

由于数据、算法和算力出现巨大增长,人工智能发展开始转向泛化能力与通用性强的预训练大模型。在百度文心大模型加持下,数字人在生产与创意类应用中的潜能也得到了释放。

日前,像度晓晓迅速完成高考作文,以唱作人的身份推出《每分 每秒 每天》单曲,作出“无界”系列画作,表明百度数字人已经具备面向多领域能力。而且其创意能力,或将掀起UGC与PGC两大生产方式之外,一种全新的内容生产方式:AIGC。

具体而言,百度文心大模型,让数字人能够通过AI技术以自动编排合成的方式生产内容。

AIGC将完全解放内容生产力,满足一些对时效性要求较高的领域。例如新闻,过去完全依赖人工创作与审校,即便如此,走完三审三校流程之后,新闻时效性已经大打折扣,而且还可能出现“谬误”。AIGC的出现解决了依赖人工创作,在可靠性与效率上的劣势。

今年两会时,度晓晓就曾在两会报道中与工人日报开辟了专栏《两会晓晓说》,为融媒体报道带来一种耳目一新的体验。

凭借在AI方面的积累,百度可以在AI各落地场景中玩各种“花活儿”,无论是作为功能型数字人的智能助理度晓晓,还是作为表演型的“虚拟车主”希加加。

反之,我们甚至可以认为,AI既是数字人的基础,也决定了数字人能力的天花板。

“数字人生产周期,从动辄几个月,缩短到小时级别。”袁佛玉在预沟通会上提到,由于百度积累了深厚的AI底层技术,其数字人的成本和制作周期优势将逐渐显现。

​三、短期拼场景,长期拼AI

任何技术,如果不能创造价值,很难持续,正是因为巨头们看到数字人背后的巨大宝藏,眼下才会鱼贯而入。

数字人需要走过如下几个阶段“外表像人,对话像人、作为人的帮手”,AI覆盖了整个过程。无论是AI建模,还是NLP,或者是更为深入的知识图谱与百度文心大模型所带来新的AIGC生产模式。

事实是,数字人短期拼场景,长期拼AI。

短期来看,市场对数字人还处于“新奇”阶段,因此主要应用场景集中在广告、电商、游戏领域。这也是为什么,主要受到文娱行业的追捧。

这里需要提到一点,作为另一种IP形式,数字人风险可控,只要不过度营销,较少出现翻车的情况。在偶像频繁塌方的情况下,确实能够填补一定市场,可是如果AI能力不能进一步提升,真正缩小与人的距离,天花板也不会太高。

市场迟早会来到成长与成熟阶段,所以从长期来看,无论是文娱,还是教育、服务、金融,AI的效能将会持续释放。

而另一头,AI能力也将改变当下各方混战的格局。眼下百度“AI路线”,已经提前完成了布局,只需要等待从春秋到战国。

到那时,没有了新奇,人们只会问如下问题:你能帮我解决什么问题。

显然,百度已经写就了答案。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈