下载客户端

斯坦福团队抄袭中国大模型，媒体：新赛道上中国不必妄自菲薄

夏天/@北京日报

2024-06-05 16:48

近日，美国斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。斯坦福团队的两位作者就这一学术不端行为正式道歉，并撤下了模型。

短短几天内，这场风波尘埃落定，与中国团队给出的证据之确凿不无关系。上个月底，斯坦福团队在网络上宣传只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。但很快就有人发现，该团队的Llama3-V模型使用的模型结构和代码与国内团队发布的MiniCPM-Llama3-V2.5极为相似。

紧接着，国内团队发现，Llama3-V可以识别出“清华简”战国古文字，“不仅对得一模一样、连错得都一模一样”。而这一古文字数据为研究团队花费数月从“清华简”上逐字扫描并人工标注得来，并未对外公开。“实锤”之下，斯坦福团队的抄袭也就无从分辩了。

诚如专家所言，尽管这次以一种令人遗憾的方式揭示了中国AI研发的较高水平，但也说明，现如今中国创业公司的大模型产品开始受到国际的广泛关注与认可。人工智能为千行万业的跨越式发展带来机遇，中国同样在追赶这一风口。截至去年底，中国有至少130家公司研究大模型产品，其中100亿级参数规模以上的大模型超过10个，10亿级参数规模以上的大模型已近80个，大模型数量位居世界第一梯队。

对于中美在大模型领域的差距，有业内人士表示，一年前，中国大模型与OpenAI、Google启动大模型研发的时间点比起来，有7到10年的差距；但如今，中美之间的差距约为6个月。曾经，一提及美国科技创新，很多人都是仰望心态。而新赛道上的表现证明，我们正在将差距不断缩小，完全不必妄自菲薄。

从长远来看，如今的大模型已从原来的纯语言模态逐步走向多模态的探索。相关研究正处于起步阶段，技术成熟度还不高，这为中国的发展提供了新的契机。就短板来说，我国在人工智能算力、算法上尚存一定差距。从加快全国一体化算力网建设，到构建算力产业链，再到加强行业算力建设布局，需要相关部门加速推进。

另一方面，我们占据了应用场景、人口规模和产业集群等优势，为人工智能技术的应用提供了广阔的场景和超大规模内需市场。在应用实践中锤炼、迭代和改进的技术，反过来又会促进应用更加深化，从而形成技术进步与应用推广相互推进的良性循环。我们要充分发挥自身制度优势，保持独立自主的精气神，更加自信地勇闯“无人区”，更加主动地拥抱世界，在部分技术不占先发优势的情况下，加快脚步、站稳脚跟。

“人工智能是引领这一轮科技革命和产业变革的战略性技术，具有溢出带动性很强的‘头雁’效应。”我们既要“紧张”起来，以时不我待的紧迫感去抢抓机遇，保持第一梯队的位置；也要“放松”下来，以更加自信的姿态，有条不紊、踏踏实实地走好自己的路。时间，永远不会辜负智慧与汗水。

责任编辑：王建亮

图片编辑：朱伟辉

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#大模型 #人工智能 #新赛道