- +1
讯飞星火大模型升级3.0,刘庆峰:完全基于国产算力平台
·据科大讯飞董事长刘庆峰透露,在基础算力平台方面,目前讯飞星火大模型V3.0完全基于国产算力平台,将来大模型的4.0版本也将完全基于华为支持的算力平台。
·刘庆峰对近日科大讯飞被曝学习机中有不当内容的传闻进行了直接回应:“该事件发生是一个意外。相关内容由合作伙伴提供,我们审核过程还没结束,相关人员就让大家试用,导致问题的出现。后续已经把大模型的内容审核机制放到学习机上,以做更严的审核。”
10月24日,科大讯飞公布了一系列相关大模型与算力平台的最新技术进展,包括讯飞星火认知大模型3.0版本、讯飞星火医疗大模型,并联合华为发布了“飞星一号”大模型算力平台。
刘庆峰正式宣布,星火V3.0已全方位超越ChatGPT,在中文上全面超越,在英文上实现对标。
5月,在讯飞星火认知大模型刚发布时,科大讯飞董事长刘庆峰曾表示,到10月24日,星火认知大模型的能力要全面对标ChatGPT。在此次发布会上,刘庆峰正式宣布,星火V3.0已全方位超越ChatGPT,在中文上全面超越,在英文上实现对标。
讯飞星火大模型V3.0的更新除了体现在文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等七个方面,刘庆峰还特意提到,星火V3.0新增了虚拟人格功能,可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。
“接下来大模型(LLM)的进化方向有3个,首先还是需要更大的模型参数,有算力可支持上万亿浮点参数(GPT-4的模型参数在1.8万亿左右)的训练,这对大模型来说是基本盘。其次,要打造AI人设,让AI可以主动问答,特别是能进行启发性、引导性的提问。最后,大模型要在各个行业场景内做更纵深的定制和服务,把大模型的多模态能力、后台的知识学习表达能力跟各个场景深度融合。”刘庆峰在第六届世界声博会暨2023全球1024开发者节期间告诉澎湃科技(www.thepaper.cn)。
科大讯飞目前还未公布讯飞星火大模型V3.0的具体参数。据刘庆峰透露,在基础算力平台方面,目前讯飞星火大模型V3.0完全基于国产算力平台,将来大模型的4.0版本也将完全基于华为支持的算力平台。
据介绍,科大讯飞和华为“联合特战队”在半年内实现了星火大模型训练和推理效率均翻番。“使用国产算力平台在早期可能会花费更多时间,这是事物发展不可避免的规律,但这个过程都是值得的。除非不想自立自强,否则便知道这步是非走不可的。”刘庆峰表示,“飞星一号”平台的发布意味着讯飞正式启动对标GPT-4更大参数规模的星火大模型训练。
刘庆峰透露,对标GPT-4的更大参数规模的星火大模型已正式启动训练,2024年上半年将实现对标GPT-4。
刘庆峰也透露了实现这一目标的具体时间表:2024年上半年将实现对标GPT-4。
基于星火大模型的首个“大模型+具身智能”人形机器人。
此外,活动现场的人形机器人引起了广泛关注。据悉,这是基于星火大模型的首个“大模型+具身智能”人形机器人。
刘庆峰表示,星火大模型的推出将让AIBOT(机器人超脑平台)赋能机器人发展进入到一个全新的阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大的提升。“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好地赋能人形机器人”。
机器人超脑平台AIBOT发布于去年1024全球开发者节。据介绍,其将认知智能、运动智能和具身智能的多模态感知能力结合,目前已为工业、教育、服务、特种等领域372家企业提供服务。
在发布会当天,科大讯飞股票于午后触及跌停,此后小幅反弹,截至收盘报收46.7元,下跌9.97%。
在采访中,刘庆峰对近日科大讯飞被曝学习机中有不当内容的传闻进行了直接回应:“该事件发生是一个意外。相关内容由合作伙伴提供,我们审核过程还没结束,相关人员就让大家试用,导致问题的出现。我们在发现相关问题后第一时间下架,对合作伙伴进行了处罚。后续已经把大模型的内容审核机制放到学习机上,以做更严的审核。”
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司