- +1
张勇宣布阿里所有产品未来将接入“通义千问”,帮助企业打造专属大模型
“面向AI时代,所有产品都值得用大模型重做一次。”
4月11日举办的2023阿里云峰会上,阿里巴巴集团董事会主席兼首席执行官张勇如此说道。
此前4月7日,阿里云推出了自研大模型“通义千问”,并邀请用户测试体验。作为“阿里版GPT”,通义千问具有多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。
在“通义千问”面世4天后,张勇宣布,未来阿里巴巴旗下所有产品都将接入通义千问。此外阿里云还表示,将面向公众开放通义千问的能力,帮助企业打造专属大模型。
澎湃新闻记者 杨阳 摄
利用“通义千问”打造专属大模型
4月11日,阿里云宣布未来阿里巴巴所有产品将接入通义千问大模型,进行全面改造。目前,阿里云并未透露产品升级的时间线,不过其表示钉钉、天猫精灵已经率先接入测试,将在评估认证后正式发布新功能。
以钉钉为例,会上播放的演示Demo显示,接入通义千问之后的钉钉可实现近10项新AI功能,包括自动生成工作方案、在会议纪要后生成总结和待办事项、根据用户上传的功能草图生成小程序等。
张勇表示,AI大模型的出现是一个划时代的里程碑,人类将进入全新的智能化时代,“就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。”
除了将自家产品接入“通义千问”,阿里云智能首席技术官周靖人还表示,将开放通义千问的能力,帮助企业打造自己的专属大模型。
周靖人在接受包括澎湃新闻记者在内的媒体采访时介绍,“通义千问”属于通用大模型,因此并不会针对企业的具体业务问题进行优化或定制。开放“通义千问”的能力,意味着企业不需要从头开始进行训练,而是能够直接在“通义千问”的基础之上,结合企业的特殊需求及行业知识,训练自己的专属模型。
“通义千问更大程度上是提供一种技术能力。我们会为企业提供一个专门的数据空间,企业可将其相关信息放入空间,在不需要进行预处理的情况下,可‘一键式生成大模型’。”他说道,未来每个企业都可以有自己的智能客服、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
周靖人进一步解释,不同的行业具有不一样的知识体系和行业规范,如何将通用模型能力与行业知识结合,是探索专属大模型的关键因素,“如今大家都处于同一起跑线上,谁能快速把专属大模型的能力发挥出来,谁就会在这一赛道处于领先地位。”
“通义千问”是节点不是终态
去年11月,ChatGPT的横空出世使得聊天机器人这一概念火遍全球,其运行基础大模型也逐渐走入公众视野。
周靖人表示,ChatGPT的出现以很好的产品形态“教育”了全社会,“以从业人员的角度来看,我们并不认为(ChatGPT的出现)是突发事件,这经历了很长期的过程。”
事实上,阿里从2019年起就已经启动大模型的研发。公开资料显示,2021年阿里先后发布国内首个超百亿参数的多模态大模型M6及被称为“中文版GPT-3”的语言大模型PLUG。此外,为推动中国大模型研发和应用,阿里在“魔搭”社区上开源了超10个百亿参数核心大模型。
周靖人强调,“我们不是赶时髦、赶潮流。阿里云的理念一直是云智一体,并不是因为ChatGPT或是最近人工智能的浪潮,才去全力投入AI。”
对于“通义千问”本身,阿里云并未透露其参数规模。周靖人在接受包括澎湃新闻记者在内的采访时表示,参数并不是唯一指标,“参数规模大代表模型在理解能力和容量等方面有更多的潜力……不同模型之间不完全可比。”
不过目前来看,OpenAI和谷歌的大模型规模似乎呈现扩大趋势。OpenAI的模型GPT-3拥有1750亿参数,其最新发布的多模态模型GPT-4参数规模有所升级,但该公司并未透露具体数字。
谷歌方面,该公司此前宣布旗下聊天机器人Bard将采用规模更大的模型PaLM。据了解,Bard的前任大模型LaMDA具有1370亿参数,而PaLM包含5400亿参数,数量几乎是前者的4倍。
对于ChatGPT,周靖人坦言,GPT技术在各方面处于领先地位,“这是科技进步的必然阶段,各个公司之间你追我赶,我们会取长补短,希望在下一个阶段能够贡献技术创新。”
“通义千问不是未来针对GPT而研发的,在大模型研究方面阿里云坚持自己的路线,过去阿里云曾做过多模态、视觉、自然语言等模型,千问只是训练大模型探索中的一个节点,并不是终态。”周靖人说道。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司