澎湃Logo
下载客户端

登录

  • +1

发布即开源:智谱AI最新视频模型支持10秒60帧4K画质,还自带音效

澎湃财讯
2024-11-08 17:42
来源:澎湃新闻
澎湃财讯 >
字号

11月8日,智谱AI清影迎来升级,发布最新版视频模型CogVideoX v1.5。升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可以一次性生成4个视频。

智谱也同步发布了音效模型CogSound和音乐模型CogMusic,可以生成与画面匹配的音效,音效功能将在本月上线公测。

新模型发布后,智谱也宣布将CogVideoX v1.5进行开源,相比于原有模型,CogVideoX v1.5包含5/10秒、768P、16帧视频生成能力,I2V模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。 

智谱AI表示,真正的智能一定是多模态的,因此希望智谱多模态大模型家族能进一步提高大模型的应用和工具能力,未来还将与视觉中国等合作,基于更丰富的视觉内容产出更好的AI生成视频工具。(澎湃新闻记者 秦盛)

    责任编辑:秦盛
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈