- +1
大模型“涌现”的2023,还留下四大流派之争
【编者按】
此刻,我们即将站在新的起点上。回望2023年,自我在生活的缝隙中流动,我们慢慢张开自己,与这个世界握手拥抱。
这是重申联系的一年。我们展出羽翼,再度感知远方的风景;我们重启对话,找回彼此信赖的温度;我们探索内心,校准人生航向的坐标;我们也拥抱变化,在时代洪流中蓄积破土的力量。“世界”是我们的限度,也代表着我们的可能,而重要的永远是联系,是我们主动或被动与万事万物的缠绕。
2023年末,澎湃新闻·湃客创作者平台策划推出《重申与世界的联系》系列文章,联合知名学者及优质创作者,从文学、艺术、科技、财经、旅行、城事等领域出发,从个体到趋势,以文字、数据、漫画、视频等形式,留下这一年里我们向世界出发的注脚。
题图:由AI生成
本文为 澎湃号·湃客科技 × 鲸选社pro 联合出品
作者 | 杨晓鹤
编辑 | 王恒婷
2023年,可能所有投资人都在问被投公司,“咱们能不能整个大模型?”
没有互联网公司想错过这波大模型热潮,最直接的吸引力——OpenAI公司估值疯涨到900亿美元。每家公司都在跃跃欲试,百亿还是千亿参数规模,自研还是套壳技术,也许都没那么重要,搞出来一个大模型开个发布会,还是非常必要的。
投资人催促,市场同行关注,客户/用户期待,这项CEO 1号工程从年初热闹到了年末,尽管李彦宏多次演讲,重复造大模型是极大的资源浪费,都没挡住国产大模型的数量。据北京市经济和信息化局数据,截止到今年10月,单是中国国内公开的大模型数量就已经达到了238个,从年中到年底数量翻了3倍,呈井喷态势。
这其中文心一言、通义千问、智谱ChatGLM等最早的大模型,还有混元、豆包等一系列重点项目,都吸引了大众关注的目光。然而在舆论关注退热后,一个现实问题摆在了企业面前:如何利用大模型赚钱?其实何止是创业公司,就算是已经上市的大企业,面对大模型的长期投入,也在思考如何活下去。
客观说,大模型市场混沌时期,各种探索都十分有益。科技的列车飞驰向前,新纪元正在开启,最终什么样类型的大模型能突出重围?我们根据市场上各大企业的大模型类型、主攻方向、商业化选择等,归纳了四大流派之争。
“自研派”VS“对标者”,生态是关键
前阿里巴巴CEO张勇曾指出,超万亿参数的大模型研发是一场“AI+云计算”的全方位竞争,囊括了算法、底层庞大算力、网络、大数据、机器学习等诸多领域,是一项复杂的系统性工程。
因此,国内仅有BAT级别的超级玩家,能够通过自研千亿乃至万亿参数的大模型,然后建立“AI+云计算”的生态,输出MaaS(平台即服务)。
百度在3月份推出文心千帆平台,业务内嵌在百度智能云生态。而文心一言则是文心千帆平台上的大模型之一,此前数据显示,文心千帆接入的第三方模型已经达到45家。百度的目标是让更多企业来到文心生态发展,就算不调用文心大模型API(应用程序编程接口),也利用百度智能云的服务,而百度通过这些底层服务能力做营收。
根据百度文心发布的公开数据显示,截至今年8月,飞桨和文心生态已有800万开发者。文心一言自8月31日面向全社会开放服务至今,用户规模已超过7000万。API是AI原生应用调用大模型的主要方式,文心大模型的调用量比国内200多家大模型的调用量总和还要多。
国内另一大模型生态是阿里云魔搭社区,据其运营人员成晨介绍,成立近一年,魔搭社区已有超过2300个模型,开发者超过280万,模型下载次数也超过了1亿多次。
据了解,文心大模型标准版收费0.8分/1000 tokens(注:token为文本中最小的语义单位),对比OpenAI看,每1000个token收费0.002美元,据说ChatGPT每个问题付出的成本是0.03美元,收费远不足覆盖成本。
微软小冰CEO李笛近期也介绍了类似案例,2018年,微软小冰给罗森做了一个销售助理,可以给2000万的罗森用户提供信息,“每次我们给罗森drive(调用)几千万次,但罗森只付我们10万元人民币,按照调用次数去计算价值。”
因此API的收入很难规模化,尤其相比训练等研发成本来说,API模式的收入杯水车薪。不过,API模式却能促成平台和生态企业的深度绑定,在此基础上,百度阿里都有向客户出售云服务的能力,这部分商业化更有前景。
与此同时,更多公司的商业化路线也在对标OpenAI。国内很多公司也在基于ChatGPT的框架训练大模型,也在学习ChatGPT的C端规模化营收能力。
这其中李开复的零一大模型受到争议较多,在被前阿里云首席科学家曝出“换名研发”后,很多人认为其Yi-34B大模型是“套壳”。零一公司内部有高管借助国外开源人士的反驳:架构是学术研究产物,数据集是自己从头训练的,这在开源领域是常见常规的事情。
字节此前被曝出违规使用OpenAI训练自己的大模型,对此字节回应在4月公司引入GPT API调用规范检查后,这种做法已经停止。
此前虎嗅的报道中,有业内人士透露:“国内真正从零到一研发大模型的可能也就三家——百度、阿里、智谱。”其余皆在对标,这种对标程度深浅不一。不仅是研发对标学习,其实商业化也在对标学习。
文心一言的App也有付费会员的选项,这部分是To C的营收。目前文心4.0的价格是连续包月49.9元,相比ChatGPT4 Plus每月20美元,价格仅为后者的三分之一左右,不过目前文心的会员数量还不详,不清楚市场的付费意愿强度。
面向C端收费,这也是字节跳动在大模型领域的主要商业化模式,其在云雀大模型的基础上,疯狂推出多款C端对话产品。字节在国内推出了对话产品豆包,海外上线AI产品ChitChop,同时豆包还有海外版本Cici。字节不同的事业部都在推出AI对话产品,其中豆包App是抖音集团推出,所以目前在抖音上的投放很多。
无论纯自研还是对标,未来二者都会赢得市场,最关键的是谁能建立商业化生态,这才是在下一阶段淘汰赛中活下来的根本。
开源 VS 闭源,如何杀出重围?
移动操作系统中,最后仅剩两家系统:开源的安卓和闭源的苹果。
而在大模型的竞争市场中,也存在开源和闭源之争。相比ChatGPT的闭源模式,即一家公司建立研发到商业化的生态闭环,开源大模型参与的玩家越来越多,声量也越来越大。尤其年中Llama 2宣布开源,更是将开源大模型推到舆论关注的前台。
但在国外开源生态中,Llama2-70B和Falcon-180B等标杆模型为“有条件”开源,设置了客户的产品月活不能过亿等上限,并因缺乏训练数据在中文能力上有明显短板。
这给了国内开源大模型发展的机会,智谱AI和百川智能是这类创业公司的代表,阿里云则是大公司的代表。
智谱最早打起开源免费竞赛,7月14日,智谱AI和清华KEG宣布对ChatGLM-6B和ChatGLM2-6B完全开放,允许企业免费商业使用。根据智谱AI的官网,ChatGLM2-6B不限实例+不限推理或微调工具包的私有化报价为一年30万。
王小川紧跟智谱打开源免费战争,百川智能相继公布Baichuan-7B Baichuan-13B开源免费可商用大模型。尽管市场上传言百川是基于LLM开源大模型的,不过因为数据训练做得不错,有企业评价其在中文环境下表现出色。
综合来看,对创业大模型公司来说,免费开源是更明智的选择。依靠开源这些参数规模较小的大模型,创业公司敲开客户企业的大门以及市场的认知。
百川在服务一定数量的企业后,后续则推出闭源的大模型,王小川解释称:“模型变大之后没有走开源的这样一种方式,因为大家部署起来成本也会非常的高,就使用闭源模式让大家在网上调用API。”
而智谱的商业化思考则比较独辟蹊径,“我最近也跟一些投资人在聊,国外真正的AI落地过程当中最明确的一个需求、一个场景就是代码辅助,大概占整个付费意愿里面50%以上的场景。”智谱AI CEO张鹏说道,“所以我们也在做类似的落地,我们有自己的代码生成模型,目前在线上也向全球超过每天10万的用户去提供数千万行代码的生成能力。”
这相当于把大模型的某一方面能力锻炼到极致,这一方面还正好是市场刚需,这样大模型就具备了赚钱能力。“智谱AI在十分努力地做商业化,可能筹备2025年登陆科创板。”一位投资人向AI鲸选社表示。
巨头中,阿里扛起了开源的大旗。12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。至此,通义千问共开源18亿、70 亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,号称实现了“全尺寸、全模态”开源。
根据公开数据显示,阿里QWEN-7B开源一个多月下载量破100万,9月25日升级了QWEN-14B;百川智能开源的Baichuan-7B、13B两款开源大模型下载量目前已经突破500万,200多家企业申请部署开源大模型。
从以上数据看,开源大模型还是有不错的潜力,市场比较认可。当然,对于核心的大模型产品,各家都选择了闭源,这是个普遍的行业现状。
唯一能改变这一现实的是,Meta正在加紧研发全新的开源大模型,支持免费商用,能力对标GPT-4,参数量比Llama 2还要大上数倍,计划在2024年初开始训练。
Meta之所以坚定地选择开源,一方面按其安卓的开源思路继续推进,另一方面,也与其后发的大模型生态必须依靠开源生态推进才可能挽回落后局面有关。
大模型中,闭源的“苹果”,毫无疑问是Open AI,而开源的领军人物是Meta还是其他企业,还有待观察。
通用 VS 垂直,谁才是未来?
当下来看,通用大模型门槛高,没有几十亿的资金体量很难做好自研和生态的工作。垂直大模型可以小到10亿参数规模,使用开源框架开发成本会更低,这给了初创公司机会。
所以在大模型火了半年时间后,行业就出现一个观点争论:大模型通用和垂直,谁是未来?
科技大V“Will”此前曾发过一组统计数据:目前国产188个大模型中:通用27个,金融16个,工业13个,媒体12个,客服11个,医学10个,政务10个,教育9个,科研9个,大学28个,互联网21个。
这意味着,研发难度较大的通用大模型属于少数,垂直大模型则占多数。比较知名的垂直大模型,有京东发布的言犀大模型、京医千询大模型,携程发布的携程问道大模型,网易有道发布的基于教育的子曰大模型。
而在大模型垂直化路线中,其实最知名的企业是华为。
在世界人工智能大会上,华为轮值董事长胡厚崑阐述道:通过“5+N+X”的这三层大模型,华为云构建了自己的大模型底座。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型。
由于外界没有接触到盘古大模型,所以对其真实能力,坊间有很多议论的声音。华为没有全部笃定在通用大模型,而是选择与行业共同打造垂直行业大模型,目前已经在盘古大模型基础上,发布了7个垂直行业大模型。
有投资人表示,通用大模型可以用向量数据库训练,垂直领域表现就会出色。而垂直大模型,其实壁垒是用行业私有数据训练大模型。
比如毫末智行推出了自己的自动驾驶大模型DriveGPT。DriveGPT学习时长达到103万小时,用户使用辅助驾驶里程8700万公里,正朝1亿公里数据规模迈进,OpenAI肯定不会喂给ChatGPT这么多道路数据。
当然,垂直大模型很难从头做框架,这也是文心等平台的另一块重要收入,就是帮企业私有化大模型。“百亿和千亿两个版本大模型,只要客户方逻辑清晰,3个月测试,3-6个月即可落地,私有大模型部署成本在四五百万元。”有内部人士讲述百度文心大模型的市场化。
朱啸虎就提到,今年年初国内私有化部署大模型需要1000万人民币,年中500万,现在不到100万。
私有化大模型和私有云一样,是个买卖型生意。而因此诞生的垂直大模型,则可以在医疗、交通、教育等等不同业务中落地。
对于垂直大模型,此前有人认为,做通用大模型能够智能涌现,垂直大模型则难以实现。而行业声音则认为,垂直大模型利用独有数据训练,这是通用大模型再聪明也难以踏入的空白地带。
其实这种通用和垂直大模型之争,取决于ChatGPT等头部玩家的进化速度。类似Q*这样的超级人工智能,可能会迅速覆盖垂直大模型的能力;而如果大模型的进化速度不够快,则是行业私有数据决定的垂直大模型效果更好。
大模型底座 VS AIGC业务,孰先孰后?
过去的应用与产品,尽管已经开始融入AI能力,但大模型带来的AI能力,还是让人眼前一亮。从2023年开始的这波AI热潮中,借助AI升级产品的公司主要分为两类。
第一类是巨头公司,旗下拥有多个数亿用户的互联网产品。借助大模型升级,让这些“传统”的互联网产品更性感。这类公司的代表是微软、Adobe和百度等。
来源:《AI一年,人间10年》PPT
微软由于一直投资OpenAI,在大模型应用领域也是近水楼台先得月。微软率先将搜索应用Bing升级为大模型版的New Bing,同时将大模型应用于Edge浏览器和Office套件中,而且将Copilot定义为未来系统级的AI助手。
受AI绘画冲击明显的Adobe,也在3月份的Adobe MA大会上,发布了3款新一代的Firefly模型:Adobe Firefly Image2 Model、Adobe Firefly Vector Model和Adobe Firefly Design Model,分别涉及图像、矢量模型和设计领域。
自今年3月发布首个Firefly图像模型以来,Adobe创意社区已使用该模型生成了30多亿张图像,其中仅上个月就生成了10亿张。Adobe曾对外表示,不仅生成图像的扩散模型是自研的,甚至文本生成的语言模型也是自研的。
不同于微软垂直于对话和Adobe垂直于图像领域,百度将其旗下几乎所有业务都在通过AI重构,包括百度搜索、百度文库、百度地图、百度网盘等。尽管产品不同,本质上都是智能搜索,这是百度的起家领域。
综合三家看,微软受益大模型最明显,在ChatGPT发布一周年之际,微软过去一年市值增加了约8000亿美元。而努力追赶AI浪潮的Adobe,过去一年,市值增加了约1700亿美元。而百度市值则略降100亿美元左右。
第二类是创业公司,他们本身拥有行业优势的AIGC业务,后续也推出了大模型业务,让原本的AIGC业务更智能。
诸如数字人独角兽公司硅基智能,在5月份发布了炎帝大模型,硅基智能将私有域知识用LLM大模型技术训练,叠加硅基AIGC数字人技术。
近期,硅基还完成了首个AI化大V-知名科普作家严伯钧。不同于常见的2D形象复制克隆人,本次将他以往发布的1400多条科普视频、100多万字的语料投喂给AI模型进行训练,实现严伯钧的肉体(形象、声音、动作)+灵魂(知识、表达)的全部AI化,相当于形成了数字生命,并且这个生命还可以AI进化,这背后就是大模型的力量。
目前可以看到,AI严伯钧每天可以高效地向全网1200万粉丝传播科普内容,而硅基的AIGC数字人也已经通过了图灵测试,在不同领域做短视频和直播。
美图的修图、设计是老本行,和AGI(人工通用智能)也十分相关。所以美图在年中发布了AI视觉大模型MiracleVision4.0版本,计划2024年1月时,将MiracleVision4.0版本将陆续应用于美图旗下产品:美图秀秀、美颜相机、Wink、美图设计室、WHEE等App中。美图的视觉大模型,几乎每两三个月更新一代,实现了照片变漫画、基础海报AI设计等能力。
但是,视觉等大模型进化并不容易。从Google的多模态大模型Gemini被爆出宣传效果实际经过了剪辑造假,包括ChatGPT-4也在艰难地从语言大模型向多模态大模型能力进发,都可以看出这一点。
大模型并不是AIGC企业营收的关键,但却是发展的必需品。以国外的AIGC初创公司Jasper估值骤降为例,没有大模型的AIGC将没有壁垒,这在行业已经形成了共识。
结语
大模型商业化的征途上,各流派都在大显身手。360公司曾经公布,其公司大模型半年曾创造2000万左右的营收,相比大模型的研发投入,其实这部分收入还比较小。各派的竞争,也没有显现出孰优孰劣。当然,商业化模式也不是最终壁垒,因为模式会很快被复制,只有能力是复制不了的核心。最终谁将笑到最后,我们拭目以待。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司