下载客户端

大模型的禾下乘凉梦，百度自己来做试验田

2022-09-29 07:28

来源：澎湃新闻·澎湃号·湃客

禾下乘凉梦，是一个今天国人无比熟悉的词。它来自袁隆平院士对杂交水稻高产的理想追求，是袁隆平的中国梦。他生前多次提到，梦想到禾下乘凉，梦里水稻长得有高粱那么高，籽粒有花生米那么大。

或许，千行百业都有这样一个“禾下乘凉梦”。科技探索会为生产与创造带来难以估量的价值，极大改变人们的生活。在AI领域，有一项技术经常让我联想到“禾下乘凉梦”，那就是预训练大模型。在袁隆平院士的梦中，杂交水稻会长得非常高大，带来极高的亩产量；大模型也是在训练数据与模型规模上非常大，在模型能力上形成巨大优势。

从2018年开始，大模型开始作为AI领域重要的技术方向被广泛关注。多年过去，我们对于大模型最大的期待，或许就在于它能不能从实验室和数据集中的“种子”，真正变成一片片赋能行业，普惠经济的稻田。

杂交水稻的发展，离不开精心耕耘的试验田。实现大模型的“禾下乘凉梦”，或许也需要这样的“试验田”挺身而出，为时代探明大模型的前进方向——这个关头，百度站了出来。

9月23日，2022万象·百度移动生态大会在广东珠海召开。会上，百度集团资深副总裁、百度移动生态事业群组（MEG）总经理何俊杰首次对外全面解读百度移动生态战略。其中非常值得注意的一点，是会上详细展示了我们熟悉的百度移动生态，是如何与百度打造的文心系列大模型深度结合，带来搜索、信息流、AIGC等领域的禾木生长。在百度移动生态中，文心大模型的能力可谓能用尽用，应出尽出。

换个角度想，如果我们想知道未来千行百业如何在大模型的禾下乘凉，那么今天百度移动生态的场景坐标，或许正指向着明天智能中国的大模型之路。

大模型3.0阶段，产业转化成为核心

在讨论百度移动生态融合文心大模型能力的重要性之前，我们必须先来了解这背后的技术与产业背景。百度移动生态与大模型融合之所以重要，是因为大模型这项技术本身正处在非常重要的发展节点。

从发展历程上看，从2018年预训练大模型开始受到行业重视算起，大模型的发展可以归纳为三个阶段。第一阶段就是所谓的“大炼模型”。传统的深度模型已经是行业主旋律，而预训练大模型作为一种新兴的技术思路，开始进入萌芽阶段。接下来在第二阶段，大模型的价值得到了产学各界的普遍认同。伴随着资本与社会关注度的广泛注入，谈AI必谈大模型成为风尚，各界也就进入从“大炼模型”到“炼大模型”的转变。在这个阶段中，各种大模型层出不穷，在训练数据参数上的扩张，技术思路的发展带来了大模型技术的繁荣。

当大模型的技术研发储备到一定阶段，新的挑战也随之而来：这么多大模型，到底应该如何与产业应用结合？这个问题如果不能妥善解决，那么大模型的繁荣发展终究是空中楼阁。所以，大模型的3.0阶段，就是从“炼大模型”到“用大模型”的转变。如何实现有效的产业转化，已经变成了目前阶段大模型领域的最核心任务。

想要用好大模型，从技术向产业的转化逻辑上看，需要具备三个前提条件：技术过硬，平台与工具齐备，有清晰明确的场景价值作为示范。而一路深耕文心系列大模型的百度，显然在前两项能力中具备先发优势。

百度自2019年开始深耕预训练模型研发，发布了知识增强文心ERNIE系列模型。2021年12月，百度与鹏城实验室联合发布全球首个知识增强千亿大模型“鹏城-百度·文心”，参数规模达到2600亿，在60多项NLP任务中取得最好效果。2022年5月的Wave Summit深度学习开发者峰会上，百度发布10个大模型，包括融合学习任务知识的知识增强千亿大模型、多任务统一学习的视觉大模型、跨模态大模型、生物计算大模型、行业大模型等，并提出支撑大模型产业落地的3个关键路径：建设更适配场景需求的大模型体系，提供全流程支持应用落地的工具、平台和方法，建设激发创新的开放生态等。

至此，文心大模型已经既包含基础的通用大模型，也包含面向重点任务领域的行业大模型，同时还具备丰富的工具平台。从技术过硬角度看，文心大模型具有知识增强的差异化优势，可以从大规模知识图谱和海量无结构数据中完成学习，从而实现模型效率更高、效果更好，具有良好的可解释性。从平台建设与产业转化上看，文心大模型具有产业级特性，提供全流程支持应用落地的工具和方法，营造激发创新的开放生态。

换言之，清晰的场景化示范价值，是文心大模型推动大模型走向3.0阶段的“最后一公里”。这个时候，百度丰富的产业生态布局，就体现出了关键价值。

百度移动生态，做大模型时代的“试验田”

在科技领域有句话，叫“自己的降落伞自己先跳”。对于希望率先探索大模型应用与产业转化的百度来说，也必须“自己的大模型自己先用”。

好在百度丰富的移动生态布局，不仅是大模型应用的价值沃土，更能以其苛刻的技术要求、清晰的能力展现、具有代表性的应用场景，成为更多开发者与企业的大模型“试验田”。

2022万象·百度移动生态大会中，我们看到了百度移动生态与文心大模型基础能力丰富多元的融合。百度移动生态，向来是百度AI技术落地的“首站”，长期秉持着AI技术能用尽用、能出尽出的原则。

而在与大模型的结合上，我们首先可以看到百度最新发布了面向搜索场景的跨模态大模型“知一”。它可以理解全网文本、图片、视频、结构化信息等形态各异的资源，从而打破资源形态的界限，将最满足用户需求的结果呈现给用户，真正实现大模型技术与搜索、信息流等百度核心业务的深度融合。

而对于更多百度移动生态中的开发者、创作者而言，基于文心大模型打造的“创作者AI助理团”可以带来划时代的AIGC体验。这个AI团队里，有文案、有插画师、有视频制作人，在这些“助理”们的齐心努力下，可以让创作者实现“一个人成为一支队伍”。

基于百度文心大模型，“AI文案助理”可以根据创作者的需求快速产出不同风格的文章标题、内容段落，“AI插画助理”可以根据关键词，自动“画”出十余种不同风格的画作，让创作者实现“配图自由”。相关能力，目前已经可以在百度APP中体验，效果十分突出。

“AI视频制作助理”基于文心大模型的自然语言处理和跨模态AI技术，让创作者的图文自动生成视频，速度可达“分钟级”。这项技术让创作者从图文到视频的创作周期缩短了3倍以上，而且也为创作者带来“一篇内容，两种收益”的效果。

“创作者AI助理团”，可说是全景式展现了大模型的一个应用价值——AIGC（AI Generated Content，人工智能自动生成内容）。基于大模型打造的AIGC能力，可以实现多种多样的AI自主创作，以及形态丰富的创作辅助功能，实现自动生产文案、自动生产图片、图文转视频等一系列技术飞跃。目前，“创作者AI助理团”已经开始邀请内测，将从今年第四季度起陆续向更多创作者开放。

由此我们不难看出，文心大模型带给百度移动生态的能力并不是“锦上添花”的简单能力升级，而是实打实的跨越式创新，甚至可以说解决了移动开发者、创作者长期以来最核心的创作门槛困扰，让创作者聚焦于创作的最核心部分。

这样的能力升级，当然对于百度移动生态的未来发展至关重要。但更重要的，可能是这种结合展示了一种可能，一种大模型走向深度产业应用的可能。

AIGC丰收时，行业转化深耕中：文心大模型的禾下乘凉梦

不久之前，科技部发布了《关于支持建设新一代人工智能示范应用场景的通知》（以下简称《通知》），指出要充分发挥人工智能赋能经济社会发展的作用，打造形成一批可复制、可推广的标杆型示范应用场景。

不难看出，以场景作为先导，快速实现AI技术的行业落地与规模化辅助正在成为目前AI产业发展的主要任务。对于大模型来说也是如此，各行业想要真正理解大模型的价值，应用大模型的能力，首先需要以场景为先导，以示范为坐标。

百度移动生态对于大模型的深入应用，正好可以构成这种迫切为时代所需要的场景示范。从大模型走向产业转化的路径上看，百度移动首先证明了AIGC的可用性。AIGC作为大模型走向产业的重要一站，更多行业可以从百度的经验中消化并吸纳AIGC的价值，从而实现自身的大模型落地。其次，百度移动生态与大模型融合，还证明了大模型与产业需求、产业真实情况的融合价值。百度移动生态拥有着巨大的流量以及多样化的业务，这些条件都是对大模型可用性的考验。

知名经济学家任泽平也在万象大会期间表示：“在AIGC的时代，百度APP作为‘前哨’和‘根据地’，是AIGC应用最广阔的天地，也将成为人人皆可用的AI新基建。这种‘百度搭台，人人唱戏’的模式，将会激发全民更大的创造力，很多新模式、新应用都会破土而出。”

从文心大模型与百度移动生态的结合，到AIGC产业实践的探索，再到更多行业应用大模型的可能，我们可以看到这个路径为大模型的3.0阶段带来了三重价值。

1.自种自证：大模型的技术能力已经趋向饱满

百度移动生态对文心大模型的应用，首先让各行业的开发者看到了大模型能做什么，有着怎样的想象力，而这归其根本来自文心大模型的技术能力。大模型的种子，需要在土壤中证明自己的价值，而AIGC与百度移动生态就提供了这样的土壤。以AI智能写作为例， ERNIE 3.0 Zeus是文心大模型最新发布的融合任务相关知识的千亿大模型，其在学习海量数据和知识的基础上，进一步学习百余种不同形式的任务知识，在各类任务表现出了更强的创作能力。从财经、体育类新闻快讯，再到诗歌、小说等文学创作，AI写作覆盖的领域越来越广，创作形式和内容也变得更加丰富多彩。

今年高考期间，ERNIE 3.0 Zeus 加持的AI数字人度晓晓挑战写高考作文，以40秒40篇的速度，获得了位列总考生前25%的成绩。 ERNIE 3.0 Zeus的智能创作能力目前已经对外开放，各行各业的广大开发者可以在线体验与定制ERNIE 3.0 Zeus的文本创作能力。再说说AI作画，AI作画这样的AIGC应用想要得到保障，背后是文心跨模态大模型的有力支撑，作为全球最大中文跨模态生成模型，文心ERNIE-ViLG参数规模已达100亿，它将「文生成图」和「图生成文」任务融合到同一个模型进行端到端学习，从而增强文本和图像的跨模态语义对齐。而近期文心ERNIE-ViLG文图生成算法迎来升级，通过渐进式扩散模型，生成空间由小及大、生成轮廓由粗到细，同时根据生成阶段自动选择最优生成网络，文本生成图像的效果取得进一步提升。可以说，每一幅AI画作的背后，都有文心大模型技术能力饱满的证明。

2.沃土通衢：产业工具与开发平台逐渐完备

各行业、各领域中的开发者，想要真正用到大模型，就需要针对性的平台与工具，从而降低技术获取门槛，提升产业开发效率。为此，文心大模型在工具化、平台化中进行了丰富的探索。以AI作画为例，文心一格是百度推出的AI艺术和创意辅助平台，是百度依托于飞桨、文心大模型持续的技术创新，在“AI作图”方面发布的产品。面向有设计需求和创意的人群，文心一格可以基于文心大模型智能生成多样化AI创意图片，辅助创意设计，打破创意瓶颈。对便捷性需求更高的开发者，还可以使用文心文图生成大模型ERNIE-ViLG 服务，极速获得沉浸式文图生成大模型的技术体验，更可灵活方便、高效地实现产品集成。这样我们可以看到，对AI作画有不同需求、不同考量的开发者，都有平台和工具来获取自己想要的AIGC能力。这就是大模型走向行业，走向应用的沃土通衢。

3.禾下乘凉：大模型规模化应用的开始

面向更广阔的行业应用前景与产业想象力，文心大模型不仅仅推动与百度业务的结合，更积极探索对外赋能的形式与方法。文心大模型具备的知识增强特性，本身就可以实现在实体问答、知识预测等领域获得更好效果，提升大模型在行业场景中的可用性。同时，文心·行业大模型采用行业知识增强技术对行业特色数据与行业特色知识学习，进而提升大模型对行业应用的适配性。目前文心已经联合国家电网、浦发银行发布知识增强的电力行业NLP大模型“国网-百度·文心”、金融行业NLP大模型“浦发-百度·文心”，已在电力、金融相关任务完成落地应用。在航天领域，文心大模型携手中国航天发布世界上首个航天大模型——“航天-百度·文心大模型”，推进航天领域AI技术应用。