下载客户端

京东发布千亿级大模型“言犀”：下半年应用于内部核心业务，明年全面开放

澎湃新闻记者范佳来实习生袁艺菲

2023-07-13 22:56

来源：澎湃新闻

∙ 10%公司 >

“大模型不应该只是拿来聊天写诗作画的玩具，供应链产业链上的大模型更有价值。模型越大，才越有可能产生产业端的智能涌现。”

7月13日，在2023京东全球科技探索者大会暨京东云峰会上，京东集团技术委员会主席、云事业部总裁曹鹏宣布旗下千亿级大模型“言犀”发布，也意味着京东正式加入大模型的厮杀战局。

对于言犀的发布，京东已经“预热”多时。对此，京东CEO许冉坦言：“京东不会把一盘色香味不俱全的菜端上桌。”

从京东提供的言犀相关资料来看，其定位是立足于产业应用的通用大模型。京东探索研究院院长、科技智能服务与产品部总裁何晓冬介绍，京东的大模型是用70%通用域数据和30%京东特有的产业数据相结合去做的训练，既拥有大模型的“常识”，并拥有产业模型的“专业”。某种意义上，既有了“通识教育”，又读了四年专业性的本科教育。

在发布同时，京东还推出支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。

此前，网易伏羲生成式人工智能相关负责人赵增曾向澎湃新闻记者介绍，目前企业入局大模型主要分为两种范式：第一种是着力于通用能力的基础大模型，普遍成本较高且十分昂贵，另一种则是基于基础大模型的行业垂直大模型，大量创业公司以此入局。

尽管京东此次发布的是垂直大模型，但据接近京东人士透露，其投入成本也相当高昂。何晓冬曾向记者坦言，目前要做好垂直行业模型的训练成本和难度并不低，因为行业模型是建立在通用模型基础上的。如果只用行业数据进行训练，会缺乏常识，因此也需要通用模型的训练。

澎湃新闻记者观察到，在今年的世界人工智能大会上，国内外总计30余款大模型集体亮相，其中既有来自企业巨头百度、阿里等推出的通用大模型，也有来自清华、复旦等学院派大模型，还有包括出门问问、第四范式等创业公司入局，竞争极为激烈，但各家公司推出的大模型似乎大同小异，并未有显著差异。

从大模型的特点来分析，此前何晓冬曾表示，在大语言模型的研发上，京东更注重的是对话方向，也在积极推进多模态模型的研发。对于外界关注的“百模大战”“群模乱舞”，他认为，目前处于大模型“百花争艳”的状态，站在这个时间点，应该思考的不是技术追赶，而是产业突破，“相信国内的大模型在中文方向将很快超越国外的对话产品。”

何晓冬透露，从数据来看，目前言犀大模型的效果在实体属性抽取准确率达到了96%、生成式多轮对话ROUGE-L达27%，多轮问答知识检索率74%。

现场，京东还宣布了未来大模型“三步走”规划：第一，在今年7月份，推出京东言犀大模型和言犀AI开发计算平台。第二，在今年下半年，将大模型应用于京东内部核心业务并形成最佳实践，针对一些重点场景的标杆客户进行对外服务。第三，在2024年上半年，将全面开放大模型能力。

对于言犀的发布，京东此前多次作出相关预热。此前何晓冬介绍，京东云入局AI研究已接近五年，2020年京东云成立“言犀”人工智能应用平台，探索语音技术、智能客服、数字人等。

责任编辑：王杰

图片编辑：蒋立冬

校对：栾梦

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

我要举报

#京东 #大模型 #2023世界人工智能大会