- +1
京东发布千亿级大模型“言犀”:下半年应用于内部核心业务,明年全面开放
“大模型不应该只是拿来聊天写诗作画的玩具,供应链产业链上的大模型更有价值。模型越大,才越有可能产生产业端的智能涌现。”
7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东集团技术委员会主席、云事业部总裁曹鹏宣布旗下千亿级大模型“言犀”发布,也意味着京东正式加入大模型的厮杀战局。
对于言犀的发布,京东已经“预热”多时。对此,京东CEO许冉坦言:“京东不会把一盘色香味不俱全的菜端上桌。”
从京东提供的言犀相关资料来看,其定位是立足于产业应用的通用大模型。京东探索研究院院长、科技智能服务与产品部总裁何晓冬介绍,京东的大模型是用70%通用域数据和30%京东特有的产业数据相结合去做的训练,既拥有大模型的“常识”,并拥有产业模型的“专业”。某种意义上,既有了“通识教育”,又读了四年专业性的本科教育。
在发布同时,京东还推出支撑大模型研发的基础设施——言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。
此前,网易伏羲生成式人工智能相关负责人赵增曾向澎湃新闻记者介绍,目前企业入局大模型主要分为两种范式:第一种是着力于通用能力的基础大模型,普遍成本较高且十分昂贵,另一种则是基于基础大模型的行业垂直大模型,大量创业公司以此入局。
尽管京东此次发布的是垂直大模型,但据接近京东人士透露,其投入成本也相当高昂。何晓冬曾向记者坦言,目前要做好垂直行业模型的训练成本和难度并不低,因为行业模型是建立在通用模型基础上的。如果只用行业数据进行训练,会缺乏常识,因此也需要通用模型的训练。
澎湃新闻记者观察到,在今年的世界人工智能大会上,国内外总计30余款大模型集体亮相,其中既有来自企业巨头百度、阿里等推出的通用大模型,也有来自清华、复旦等学院派大模型,还有包括出门问问、第四范式等创业公司入局,竞争极为激烈,但各家公司推出的大模型似乎大同小异,并未有显著差异。
从大模型的特点来分析,此前何晓冬曾表示,在大语言模型的研发上,京东更注重的是对话方向,也在积极推进多模态模型的研发。对于外界关注的“百模大战”“群模乱舞”,他认为,目前处于大模型“百花争艳”的状态,站在这个时间点,应该思考的不是技术追赶,而是产业突破,“相信国内的大模型在中文方向将很快超越国外的对话产品。”
何晓冬透露,从数据来看,目前言犀大模型的效果在实体属性抽取准确率达到了96%、生成式多轮对话ROUGE-L达27%,多轮问答知识检索率74%。
现场,京东还宣布了未来大模型“三步走”规划:第一,在今年7月份,推出京东言犀大模型和言犀AI开发计算平台。第二,在今年下半年,将大模型应用于京东内部核心业务并形成最佳实践,针对一些重点场景的标杆客户进行对外服务。第三,在2024年上半年,将全面开放大模型能力。
对于言犀的发布,京东此前多次作出相关预热。此前何晓冬介绍,京东云入局AI研究已接近五年,2020年京东云成立“言犀”人工智能应用平台,探索语音技术、智能客服、数字人等。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司