下载客户端

频频破圈，走向百业：大模型的毕业季

2022-06-17 13:21

来源：澎湃新闻·澎湃号·湃客

人间六月，满眼芳菲。很多人将在这时迎来人生中又一个毕业季。与熟悉的课堂、校舍、同学道别，走向新的学府，或者走向自己选择的行业。

这个情感浓烈的六月，却与往昔有点不同。除了人类的青春故事依旧精彩，AI大模型也在毕业季频频出圈。最近，百度的数字人度晓晓，向我们完美展示了一枚AI同学如何度过一个完美六月。先是写高考作文，后是画作参加美院毕业展，紧接着还跟龚俊一起创作音乐。难怪很多同学表示，我的毕业季可没有AI那么精彩……

支撑度晓晓实力破圈的，是百度自主研发的文心大模型。

几年以来，大模型可以说是AI领域，乃至整个科技界的核心热词之一。我们经常会听到某公司/科研机构训练了新的大模型，参数规模打破了记录；却很少听到某行业/领域真的用到了大模型。从2018年十月谷歌AI发布bert开始算起，大模型到这个六月正好度过了“大学四年”。换言之，这项被赋予期望的技术，也该迎接自己的毕业季了。

此前，我们看到的是大模型无尽的提升训练模型参数，无尽的刷新数据集测试分数，并且有各种各样新的技术思路加入大模型训练。但面向未来，我们可能只需要以一种思路来评判大模型：能不能带来产业价值。

度晓晓的出圈，确实刷新了很多人对AI的认识。但更重要的是它通过一系列动作，向产业证明了预训练大模型如何跨越技术屏障，真正与产业结合，向开发者与千行百业开放生态。

2019年，百度率先发布了中国首个正式开放的预训练模型ERNIE1.0，开启了中国大模型的“入校生涯”；2022年，文心大模型第一个冲出实验室、数据集的大门，引领了全球大模型的“产业岁月”。

能够做到这一切的原因，在于文心大模型正确回答了三道“毕业考试题”。

先答这道“证明题”：一系列出圈动作背后的技术跨越

短短几天之内，百度数字人度晓晓首先挑战高考作文。参与作答了全国新高考Ⅰ卷的《本手、妙手、俗手》议论文写作，40秒就根据题目创作了40多篇文章，平均1秒生成1篇，随机抽取其中一篇，分数已赶超约75％高考考生。

紧接着，度晓晓带着她的画作参加了西安美术学院2022年“时空留痕·无界西美”本科毕业展，开设了自己的专属展区。她平均只需数十秒就能完成一幅有意味，充满鲜明艺术特质的画作，被美院老师评为已经具有毕业生水平。

这两件事当然让AI数字人实力出圈。而在行业内人士看来，这两件事的核心意义在于，文心大模型做了两道难度非常高的技术证明题，展示了大模型不是只能纸上谈兵，而是能够应对真正的产业场景。

在以往的大模型测试中，所使用的基本是内容固定、方向单一的数据集。这种测试当然有一定价值，但却与产业中需求多样、数据样本稀少、用时要求苛刻的环境有天壤之别。

比如说高考作文写作就是这样一个任务。高考作文比一般的文本生成任务更长，而且需要保证长文各个段落之间的逻辑性和连贯性。与此同时，写作需要彻底理解并且紧扣主题，从而保证中心突出，确保所有信息准确指向踩分点。这种真正考人，而不是考AI的任务，就是对大模型的一个巨大挑战。在AI写作高考作文中顺利完成任务的，是百度使用了最新推出的文心·NLP大模型 ERNIE 3.0 Zeus。它就像个见多识广的“尖子生”“学霸”，理解能力和创作能力比传统模型更强。最终展现在我们面前的，就是一篇文辞华美、立意准确的高考作文。

再说说参加毕业画展。我们知道，大模型的特征之一就是不仅能够处理自然语言处理任务，还在机器视觉、跨模态、知识图谱等领域取得了巨大进展。度晓晓在美院画展上创作的“无界”系列画作，从不同角度诠释了AI理解的“无界”，就展现出了文心大模型跨模态图文生成模型ERNIE-ViLG，所具备的强大跨模态理解和生成能力。

跨模态理解信息，生成内容，是人类智力的专属价值，也是AI的核心努力方向。根据题目创作画作，需要AI对给到的信息进行深度理解，紧接着结合自身联接的知识进行信息拓展，进而阐述创作的灵感，最终再以跨模态生成的方式完成画作。文心大模型的这一系列操作行云流水，而且真正做到了信息准确与艺术表现力的统一。这种智商与情商兼具的艺术家，其实才是最难得的。

这两件出圈之举，可以说是文心大模型回答的证明题：向业界证明了AI大模型不仅能够堆参数，跑数据集。还能够无差别参加那些只有人类才能参加的活动，并且给出不属于人类的完成水准。我们已经不需要谨小慎微地给大模型出题了，广阔天地，四海八方，或许都是AI可以参与一答的题目。

当然，写作文与作画背后，不仅是文心大模型的技术能力自证，同时也是AIGC产业方向的清晰标识。能够写文作画的AI，当然也可以在更多内容生产中大展身手。比如AI写歌、AI剪辑等等。

于是，刚刚放下答题纸和画笔的文心大模型，就跑去写了首歌，顺道组了个CP。

再来看看“多选题”：和龚俊组CP展示出的应用价值

毕业季中，走向社会的年轻人不仅需要证明自己的能力，还需要选择清楚自己的道路——大模型当然也是如此。

于是我们看到，大模型正在越来越多的岗位发光发热，并且还是与明星一起。6月14日，度晓晓与龚俊数字人联合演唱的《每分每秒每天》歌曲MV成功刷屏。这是国内首支从作词到编曲都是由AI来完成的虚拟偶像单曲。

此外，度晓晓与龚俊数字人已经入驻百度APP。在用户使用百度APP的时候，可以通过搜索框或者底部的语音按钮发起聊天类需求。比如用户说“你好，你多大了，我想你了，我想聊天”，会直接进入搜索负一楼的对话式框架。度晓晓&龚俊数字人会在负一楼陪伴用户，进行具有深度的语音对话。

为了这份随时随地的陪伴，文心大模型提供了整合了多模态交互技术、机器翻译、语音识别、自然语言理解等多项能力，从而实现了个性化聊天陪伴、辅助搜索、服务分发和互动玩法四大功能为一体。在百度APP中，用户可以直接通过个性化聊天来感受大模型的能力和魅力。文心大模型可以呈现出有上下文联系，自然生动的聊天互动，并且在对话中识别用户是否有搜索需求、服务类需求等进行辅助。而这背后，是全球首个生成式开放域对话大模型PLATO。

PLATO当然有着一系列技术差异性，但或许更重要的是，它清晰展示出了预训练大模型如何与具体的应用场景、实际应用任务相结合。大模型的价值清晰展现在了对以往APP交互的超越上，通过开放域对话大模型，APP可以向用户提供超越以往搜索服务与语音助手服务的全新价值。其体验更加接近与真人互动，并且比传统的关键字搜索会更加人性化、更有针对性，能够更加准确理解用户的需求。

大模型的应用价值，不在于能够替代此前的某种技术。或者说不仅于此，而是可以做出“多选题”，集成多样化的价值，应用于多样化的产业需求。

在数字人生成、智能客服、AIGC等等领域，可以看到文心大模型都有着真实且广泛的产业级应用落地。

一起来做这道“开放题”：大模型刚刚毕业，却已经走向百业

也许那边的朋友要问了：这么好的大模型，什么时候才能体验到呢？答案是，现在。

文心大模型已经是一道开放题，等待着千行百业的你来一起写画她的毕业作品。

举个例子，上文提到的ERNIE 3.0 Zeus是文心大模型最新发布的融合任务相关知识的千亿大模型，也是国内首个开放API调用的千亿大模型。该模型在学习海量数据和知识的基础上，进一步学习百余种不同形式的任务知识，增强了模型的效果，在各类NLP任务上表现出了更强的零样本和小样本学习能力。而ERNIE 3.0 Zeus的智能写作功能目前已经上线旸谷社区，开发者可以即可体验到这些前沿技术带来的价值。

既很强，也很落地，或许可以被称为文心大模型的毕业季口号。这背后是文心大模型的两大核心特色：产业级和知识增强。

“知识增强”是文心大模型的核心技术差异，即通过引入知识图谱，通过“知识增强”的方法，将数据与知识融合，使得文心大模型相较于其他模型，学习效率更高、可解释性更好。这是文心大模型能够超越众多“同学”，率先走向就业的技术保障。

而“产业级”则是百度在大模型落地领域的经验、技术、产品设计与生态培养等等能力的融合。一方面，文心大模型的技术来源于产业，从设计与技术上就倾向产业应用；另一方面，文心大模型建设了一系列配套能力和工具，通过多种方式降低大模型应用门槛，提升其真实应用的可行性。

在这两大特性的保证下，百度在全球范围内开启了一场让大模型走向产业的“毕业旅行”。写高考作文，画毕业作品，与明星一同写歌，都可以看作这场旅行中的一些风景。在更广阔的产业原野上，百度还将文心大模型不断升级，瞄准各行业的智能化需求。不久之前的WAVE SUMMIT 2022深度学习开发者峰会上，文心大模型迎来一系列升级：发布10个新的大模型，同时提出了基础大模型、任务大模型、行业大模型构成的三级体系。让不同的应用场景、行业需求有不同的大模型支撑，真正让大模型走向千行百业。与此同时，考虑到开发者、应用者不同的使用需求和开发能力，百度还围绕文心大模型提出了一系列产业落地的关键路径，比如建设更适配场景需求的大模型体系，提供全流程支持应用落地的工具、平台和方法，建设激发创新的开放生态等。为促进大模型惠及最广泛的行业与开发者，配套发布大模型套件、API体系，以及旸谷大模型创意社区，全方位帮助开发者更低门槛地应用。

如今，智能作画、智能对话、智能创作、故事生成等大模型创意应用已经上线旸谷社区。百度与国家电网、浦发银行等行业头部企业进行了联合研发与创新，成功实现了行业大模型在产业中落地生根。

从应用深度上看，在百度内部文心大模型也全面应用于智能搜索、信息流、智能音箱等互联网产品，大幅提升了用户获取信息、知识和服务的效率和体验。在百度之外，文心大模型的落地应用已经覆盖工业、能源、教育、金融、通信、媒体等众多行业，例如工业领域的零部件质量检测、能源领域的输电线路巡检、金融行业的合同信息抽取等等，帮助企业实现智能化升级。