澎湃Logo
下载客户端

登录

  • +1

“企业对模型成本也变得敏感”,智谱大模型宣布再降价

澎湃新闻记者 张静
2024-06-05 18:35
来源:澎湃新闻
未来2% >
字号

·企业对模型成本变得敏感,希望得到更加强大、快速、成本更低的模型。越来越多的企业希望拥有独立的私有模型,将自有数据转化为竞争力和生产力。模型效果和价格同样重要。

智谱AI COO张帆。

虽然业界对于大模型价格战众说纷纭、褒贬不一,但作为明星大模型公司的智谱AI(即北京智谱华章科技有限公司)显然是价格战的拥趸者。6月5日,该公司COO张帆在智谱AI开放日上再次宣布大模型降价,将他们目前“最能打”的一款小模型GLM-4-Flash版本降至0.1元/百万 Tokens,这意味着“写两遍《红楼梦》只需1毛钱”。这距离该公司上一次降价仅过去了不到一个月时间。

据介绍,降价的模型还包括GLM-4-Air,价格降为1元/百万 Tokens,GLM-4-Air极速版价格为10元/百万 Tokens,在效果不变的情况下生成速度达到71 Tokens/秒 ,这意味着模型每秒可展示100多个汉字。

应用端对大模型有更多期待

在字节跳动宣布豆包主力模型价格进入“厘时代”之前,今年5月,智谱AI打响模型价格战,个人版/入门版GLM-3 Turbo模型调用价格由5元/百万 Tokens降为1元/百万 Tokens,相当于0.001元/千 Tokens,而0.001元就相当于1厘。使用入门级大模型创作10000条350字的小红书文案,仅需大约1元。

“今年,应用端对大模型有了更多期待”,张帆表示,企业对模型成本也变得敏感,一方面希望得到更加强大、快速、成本更低的模型,另一方面,越来越多的企业希望拥有独立的私有模型,将自有数据转化为竞争力和生产力。

智谱ChatGLM3-6B全部升级为GLM-4-9B,上下文⻓度8倍提升至最高1M(约两百万字),支持26种语言。“这是我们最能打的小模型,综合能力比上一代提升40%。在智谱AI开放平台上,我们把它纳入了API家族,变成GLM-4-Flash版本,而它的价格相对于之前的GLM-3 Turbo继续降价,降至0.1元/百万 Tokens。”张帆表示,GLM-4仍是市场上最受欢迎的模型之一,GLM-4提供100元/百万 Tokens。而GLM-4新API模型发布,GLM-4-Air兼具极速与效果,性能接近GLM-4,GLM-4-Air价格达到1元/百万 Tokens。

“企业应用到深水区时,不光需要一个更好的模型,还需要非常快的速度。”张帆表示,为此推出10元/百万 Tokens的GLM-4-Air极速版,在效果不变的情况下提升推理速度,生成速度达到71 Tokens/秒 ,这意味着模型每秒可展示100多个汉字。

除了语言模型,智谱多模态模型进一步降价,GLM-4V降价50%,降价后价格为50元/百万 Tokens。文生图模型Cogview-3降幅超50%,每张图片0.1元。

在开源生态加持下,企业训练模型的门槛已经大幅降低,但训练模型的过程依然复杂,企业需要部署模型和推理算力,观察和验证效果等,张帆表示,“几十个步骤对于绝大多数企业来讲还是太难了,所以我们全面升级了模型平台,准备训练数据、创建微调任务、部署微调模型,仅需三步企业就可以训练私有模型并应用起来。在性价比之王LoRA微调模式下,GLM-4每千Token只需4毛钱,而GLM-4-Air每千Token只需3分钱,这比起训练一个千亿模型动辄需要多台A800级别的服务器已是大幅降低了门槛。”

“Scaling Law并未失效”

大模型技术创新依旧突飞猛进,甚至速度越来越快。

智谱AI CEO张鹏表示,大模型尺度定律(Scaling Law)并未失效,AI技术的增长进入了一个全新阶段。超级认知、原生多模态等新技术路线已逐渐成为共识,有望解决目前大模型存在的幻觉、推理缺陷等问题。通过AI的自我解释、自我评测、自我监督,人类有希望构建超过人类平均水平超级的认知智能。

但想象力只有转化为现实的生产力才具有真正的革命性意义。张帆表示,价格是快速推动人类前往通用人工智能的必要路径,让AI更加普惠。

小米集团小爱团队总经理王刚表示,模型价格对于To C产品很重要,覆盖上亿用户的产品每天需要2000亿Tokens-3000亿Tokens,对于企业而言,这是巨大成本。“在大模型的使用上还是只能覆盖成本比较高的设备,对于相对低端的大众设备,我们现在覆盖不了大模型的成本。但现在最新的大模型降价后,我们有机会把大模型能力覆盖到全终端、全设备。”

另一方面,模型效果同样重要。“企业用户在意价格,但不是最在意价格。如果最终大模型能够帮助企业增加收入或利润率,即使大模型再贵也会用。”住房公积金和银行业数字化解决方案供应商华信永道副总经理吴文表示,如果大模型无法为企业带来实际价值,即使价格下降,企业也会有其他选择。

北京智源人工智能研究院院长王仲远曾表示,大模型卷价格是一把双刃剑,价格降低有利于产业普及和推广,但如果价格低于企业实际成本,将扰乱市场。他建议大模型企业通过技术提升和改革降低成本,而不是仅仅为了占领市场而降价。张鹏表示,智谱AI通过模型核心技术的迭代和效率的提升,以技术创新实现应用成本持续降低,并非简单的价格战。

    责任编辑:宦艳红
    校对:刘威
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈