- +1
美团王兴躬身入局,AI大模型赛道还有谁?
3月8日,美团创始人王兴在朋友圈中透露,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。
他表示:“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。”
自从ChatGPT这颗星星升起,不仅在科技圈引起哗然,更是点燃了创投圈的创业激情。国内企业的大规模预训练模型(以下简称“大模型”)赛道也已经开始进入白热化的竞争阶段。前有百度、字节等巨头诸侯争霸,后有创企百家争鸣,利用自身应用场景与数据优势开始竞争发力。
接下来,数据猿将梳理一下近期投身大模型领域的诸多玩家。
铁打的赛道,流水的玩家
大模型赛道是真的“很香“,诸多大咖也已入阵。毫无疑问,这一轮的AI创业大潮,完全是精英们的竞赛。而前美团联合创始人王慧文的“英雄贴”,更是直接拉开了国内类ChatGPT创业的序幕。
1、前美团联合创始人王慧文:广发“AI英雄帖“
王慧文离开美团之后的创业意向,在思考过Crypto、Web3后,终于决定进军ChatGPT。2023年2月13日,王慧文在社交媒体平台郑重地说道“即使只有一个人,我也要出发”。这是王惠文进军OpenAI的信号。随后,他在即刻平台高调地发布了一个“AI 英雄帖”,广纳AI研发人才,打造中国OpenAI,特设北京光年之外科技有限公司。王慧文坦言,个人出资5千万美元,且个人肉身不占股份,资金占股25%,75%的股份用于邀请顶级研发人才。一个想法,一家公司,在尚未成型落地之际,已吸引了下一轮2.3亿美元的认购。
2、出门问问创始人李志飞:打造中国的OpenAI
据了解,当王惠文在发布那条“AI英雄帖”时,出门问问的创始人兼CEO李志飞就坐在其对面,李志飞表示自己一定会参与。曾是Google总部科学家队列一员的李志飞,在人工智能语音语义技术领域拥有近二十年的科研及产业经验。2012年,他回国创立了人工智能公司出门问问,是除去百度、搜狗之外少有的搜索产品,其项目估值一度达到10亿美元。李志飞曾在2020年领导团队训练出一个大模型GPT-3中文版UCLAL。毫无疑问,大模型是他的主战场。
李志飞说:“看到了一个通用认知模型的希望。语言、知识、逻辑、规划等问题,都看到了迎刃而解的可能。” 而因为宣布“要在大模型领域创业,打造中国的OpenAI”一事,其近期也是备受科技圈的关注。
3、亚马逊李沐、Alex Smola离职:师徒一体,携手再次创业
3月7日,李沐大神疑似加入大模型创业的消息,瞬间在社交网络上刷屏。其创业项目,名为Boson.ai。从官网信息来看,创业内容与大模型应用有关。与其携手创业的,是李沐的导师,另一位前亚马逊AI大牛:Alex Smola。领英资料显示,这位前亚马逊副总裁、杰出科学家出任的是新公司的CEO。另根据Alex的领英主页介绍,“我们正在做一件大事。如果你对可扩展基础模型感兴趣,请联系我”。值得注意的是,在这家公司GitHub主页上,亚马逊首席科学家李沐也贡献了代码。
4、前京东AI“掌门人“周伯文”:大模型并非大厂专属
3月1日,专注于企业创新数智化的技术服务公司衔远科技宣布已完成数亿元天使轮融资。本轮融资由启明创投领投,经纬创投跟投。衔远科技的创始人周伯文可是大有来头。其有着20多年的自然语言生成、对话与交互式人工智能的研究经验。在2016年提出的“自注意力融合多头机制的自然语言表征机理”,是Transformer架构的核心思想之一。 在创办衔远科技之前,周伯文是原京东集团高级副总裁、集团技术委员会主席、云与AI总裁,京东人工智能研究院院长,简单理解就是京东AI“掌门人”。在京东之前,周伯文曾担任IBM Research美国总部人工智能基础研究院院长。
5、前搜狗CEO王小川:OpenAI的成功首先是技术理想主义的胜利
就在上个月,原搜狗CEO王小川发了一个朋友圈,隐晦的表示自己会下场进入“中国OpenAI”的战争中。王小川曾在1996年获得国际奥林匹克信息学竞赛金牌,进入清华大学。毕业进入搜狐后,在2004年主导推出搜狗搜索,并在其27岁那年成为彼时中国互联网界最年轻的高管。这些技术天赋逐渐转化成实在的技术实力——搜狗输入法的成功不仅对搜狗意义重大,作为最早的中文输入法之一,它也给中文的语言AI打开了许多入口。王小川用“技术理想主义”一词,定义了类似OpenAI的创业项目。它不仅仅是一个创业项目,更是技术理想的穷尽实验。
在2022年6月,王小川设立了人工智能技术公司:北京百方众智信息技术合伙企业,并占股80%。据了解有媒体向王小川本人求证是否回归创业做AI大模型时,王小川承认自己在“快速筹备中”。
6、快手前AI核心人物李岩创业,投身大模型赛道。
李岩是工号在75上下的快手老员工,也是快手AI技术研发的核心人物。2015年11月,在时任快手CEO宿华的支持下,李岩组建了内部第一个深度学习部门DL(Deep Learning)组,目标是构建算法模型对违法违规的视频内容进行识别。
据悉,李岩于2021年提出离职,并于2022年下半年成立了AI公司“元石科技”,主要进行多模态大模型的研发。早在2018年,李岩就在公开场合强调了多模态技术的重要性。
ChatGPT这把火,蔓延到了整个创投领域。那么大模型到底有什么魔力,使其成为热门创业赛道,吸引如此众多大咖纷纷入局?大模型赛道在AI中占取什么样的地位?我们可以带着这样的疑问来看接下来的分析。
巨头or创业公司?
伴随OpenAI开发的ChatGPT的大火,国内外巨头纷纷瞄准该赛道,谷歌、百度、京东、科大讯飞等国内互联网公司纷纷表示自家在ChatGPT上已有布局,并有相关产品要推出。
现在的大模型赛道中,挤满了巨头派、大佬派、海归/大厂高管派、小创业公司转型派、教授派、酱油派等各路选手。抢占大模型赛道头牌的战争已经彻底打响,但花落谁家还尚未可知。
目前,谷歌、微软、亚马逊、百度、阿里、腾讯等科技巨头公司在大模型发展方面具有显著的优势,均有相关雄厚的技术资源和能力,且都在通用大模型上进行了布局与投资。
创业公司想要和巨头分一杯羹,容易吗?
总体而言,大模型的分水岭主要集中在技术研发、数据和算法资源、商业化能力、人才储备和管理能力四个方面。
首先,在技术研发能力方面。
就目前来看,巨头拥有更强的技术研发能力和更丰富的资源,可以投入更多的人力、物力和财力来开展大模型的研究和开发。他们拥有更完善的数据、算法和硬件等技术支持,能够更快速地推进大模型的研究和应用。
对比巨头和创业公司,技术上的差距在一定程度上取决于人工智能领域内的领先者和后来者。巨头公司如Google、Facebook、Microsoft等在人工智能领域拥有大量的数据、计算资源和技术经验,因此有更多的能力来训练和优化大模型,推动人工智能技术的发展。
而创业公司通常缺乏这些资源,需要在技术研发方面付出更多的努力,面临着更大的技术难关和不确定性。
其次,在数据和算法资源方面。
巨头拥有更丰富和更完善的数据和算法资源,能够更好地支持大模型的训练和推理。他们能够利用自身的平台和业务优势来积累海量的数据,并在此基础上进行算法研发和优化。而创业公司通常无法获得这样的数据和算法资源,需要通过自己的努力来积累数据和优化算法,这需要更多的时间和精力。
以OpenAI发布于2020年的GPT-3来看,其具有1750亿个参数的大模型。在算力方面,人工智能模型的训练和使用需要强大的算力,这就需要大量高性能的GPU来支撑。在数据方面,据了解,ChatGPT的训练使用了大约45TB数据,其中包含多达近1万亿个单词的文本内容。
但是,由于大型模型需要大量的计算和存储资源,对于初创公司来说,资金和技术限制可能成为了限制因素。
另外,在商业化能力方面。
巨头拥有更强的商业化能力和更完善的商业化渠道,能够更好地将大模型应用于商业领域,实现商业价值。他们可以借助自身的品牌和用户基础,将大模型应用于搜索、推荐、广告等领域,并实现商业化变现。
而创业公司通常缺乏这样的商业化能力和渠道,需要花费更多的时间和精力来探索商业化路径和拓展商业合作。
最后,在人才储备和管理能力方面
巨头拥有更强的人才储备和更完善的管理能力,能够更好地吸引和管理高端人才,构建更具竞争力的团队。他们可以通过自身的品牌和声誉,吸引到更多的高端人才,并通过自身的管理经验和制度建设,提升团队的协作效率和创新能力。
而创业公司通常缺乏这样的人才储备和管理能力,需要付出更多的努力来构建高端团队和提升管理能力。
虽然,随着技术的不断成熟,越来越多的创业公司也开始利用云计算、分布式计算等技术来加速大模型的训练和优化,不断挑战巨头公司的技术垄断。创业公司在人工智能领域也有很多机会,但需要更多的创新和勇气来打破技术壁垒和市场垄断。
总之,大模型作为人工智能领域内的重要技术,已经成为了热门的创业领域。巨头公司拥有更多的资源和技术经验,但创业公司也可以通过创新和勇气来不断挑战技术垄断,创造新的商业价值。
蹭热点,还是真有本事?
今年全国两会期间,人工智能更是成为热议话题,代表委员们提交的议案、提案中,人工智能大模型、ChatGPT等词汇高频出现。多位全国人大代表、全国政协委员更是将视野聚焦“如何发展中国自己的ChatGPT”,为人工智能的发展献言献策。
科技部部长王志刚表示,我国在人工智能大模型方面做了很多布局,也有一些成果,但要达到ChatGPT的效果,可能还有工作要做。“我也希望我们的科研院所、企业、广大科研人员能有进一步发展和进步,为国际社会作出中国贡献。”
全国政协委员、360集团创始人周鸿祎在提案中建议,建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+OpenAI”组合;针对多条技术路线,设立国家级AI大模型长期开源项目,打造开源众包的开放创新生态。
全国人大代表、科大讯飞董事长刘庆峰提交了建议加快推进我国认知智能大模型建设、开展相关伦理研究等八大建议。他表示,应当“加快推进我国认知智能大模型建设,在自主可控平台上让行业尽快享受AI红利,让每个人拥有AI助手”。
可以看到,国家也已关注到大模型的发展,但如今涌现出的各类人士意欲闯入大模型赛道,究竟是蹭热点还是真的有实力呢?
值得注意的是,原美团联合创始人王慧文发出豪言壮志,但却不被海通证券分析师郑宏达的不被看好,郑宏达表示,“纯扯淡,5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?互联网的人啥都不懂,就只会营销,一点都不踏实。”
整体来看,大部分宣布进入该赛道的人员都是在人工智能领域有着很高的知名度和实力的专业人士,他们涌入大模型赛道,多是因为大模型赛道的兴起和相关技术的进步为他们提供了更多的机会。
虽然不乏蹭热点的人群,但由于数据量和模型复杂度的增加,大模型赛道对计算资源、算法设计、模型优化等方面提出了更高的要求。因此,涌入大模型赛道的专业人士都必须具备深厚的人工智能理论知识、丰富的实践经验和强大的计算资源等条件。大模型赛道已经成为了人工智能竞赛领域的一个重要赛道,而他们的实力和经验也将为这个领域的发展注入更多的动力,不过究竟谁能逐鹿群雄仍需时间考证。
文:媛媛 余小鱼 / 数据猿
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司