澎湃Logo
下载客户端

登录

  • +1

以后人手一个ChatGPT?微软宣布开源大模型训练神器

2023-04-15 15:53
来源:澎湃新闻·澎湃号·湃客
字号

来源丨元宇宙简史

编写丨元宇宙简史编辑部

【元宇宙导读】Deep Speed Chat的最大优势,是它可以大幅提升训练速度和降低训练成本。据微软称,Deep Speed Chat可以在一块GPU上训练高达130亿参数的对话模型,或者在Azure云上以300美元的费用训练同样规模的模型。

近日,微软宣布开源Deep Speed Chat,一款基于Deep Speed深度学习优化库开发的工具,旨在帮助用户轻松训练类ChatGPT等大语言模型。

 

Deep Speed Chat的开源,将显著降低用户获得大模型的成本,加速大模型在千行百业的应用落地。

01、什么是Deep Speed Chat?

Deep Speed Chat是微软在2023年4月发布的一个开源项目,它利用了Deep Speed的优化技术,如ZeRO和LoRA,以及一种新的训练技术,叫做Reinforcement Learning with Human Feedback (RLHF),来训练大规模的对话模型。

RLHF是一种利用人类反馈来指导模型学习和改进对话技能的强化学习方法,它可以让模型生成更自然、更有趣、更有用的回复。

Deep Speed Chat还支持数据混合,即让模型从多个数据源中学习,并生成多样化的回复。此外,Deep Speed Chat还提供了一个简单易用的训练界面,让用户可以使用预训练的Huggingface模型,并通过Deep Speed-RLHF将其转化为一个定制化的对话模型。

02、Deep Speed Chat有什么过人之处?

Deep Speed Chat的最大优势,是它可以大幅提升训练速度和降低训练成本。

据微软称,Deep Speed Chat可以在一块GPU上训练高达130亿参数的对话模型,或者在Azure云上以300美元的费用训练同样规模的模型。

 

相比之下,目前最先进的对话模型,如OpenAI的GPT-4,拥有数千亿参数,训练一次的成本接近500万美元。

除了规模和成本之外,Deep Speed Chat还具有其他方面的优势。

例如,它可以支持更大的批量大小和更长的序列长度,从而提高数据利用率和模型性能。它还可以利用Deep Speed的内存优化策略,如ZeRO和LoRA,来支持高达数千亿参数的超大规模模型。

此外,它还可以通过RLHF和数据混合来提高模型的对话质量和多样性。

03、Deep Speed Chat的应用前景如何?

Deep Speed Chat的开源,无疑为用户提供了一个更便捷、更经济、更高效的训练大语言模型的途径。

这意味着用户可以根据自己的需求和场景,定制出适合自己的对话模型,并将其应用于各种领域和行业。

 

例如,用户可以利用Deep Speed Chat来创建智能客服、智能助理、智能教育、智能娱乐等各种类型的对话系统,并提升用户体验和满意度。

严正声明:本文为元宇宙简史原创,未经授权禁止转载!内容仅供参考交流,不构成任何投资建议。任何读者若据此进行投资决策,风险自担。

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈