- +1
英伟达推出世界基础模型,训练机器人和自动驾驶汽车
当地时间1月6日,英伟达在于拉斯维加斯拉开帷幕的2025CES(国际消费类电子产品展览会)期间,推出了涵盖生成世界基础模型的Cosmos世界基础模型平台,旨在加速自动驾驶汽车、机器人等物理AI系统开发。
“机器人的ChatGPT时刻即将到来。与大语言模型一样,世界基础模型对于推进机器人和自动驾驶汽车的开发至关重要。”英伟达创始人兼首席执行官黄仁勋在发布会上表示,英伟达创造Cosmos是为了让物理AI民主化,让每个开发人员都能接触到通用机器人。
Cosmos是为物理交互、模拟工业环境和驾驶环境的高质量生成而构建,它可从文本、图像和视频等输入以及机器人传感器或运动数据的组合中生成基于物理的视频。该模型生成逼真的视频可用于训练机器人和自动驾驶汽车,通过创建合成训练数据帮助机器人和汽车理解物理世界,成本远低于使用传统数据。
英伟达表示,物理AI模型开发成本高,需要大量真实世界数据和测试。Cosmos为开发人员提供了一种简单的方法来生成大量基于物理的合成数据,以训练和评估模型。开发人员也可以通过微调Cosmos来构建定制模型。
在今年的CES开幕演讲中,黄仁勋展示了开发人员使用Cosmos的方法,例如开发人员能够从视频数据中轻松找到下雪的路况、拥堵的仓库等特定训练场景,使用Cosmos模型从英伟达Omniverse仿真平台开发的受控3D场景生成真实感视频,使用Cosmos和Omniverse生成AI模型可以采取的每一种可能的未来结果。
人形机器人企业Agility首席技术官普拉斯·韦拉加普迪(Pras Velagapudi)表示,数据稀缺和可变性是机器人环境中成功学习的关键挑战。“Cosmos的文本、图像、视频、世界能力使我们能够为各种任务生成和增强逼真的场景,而不需要大量昂贵的真实世界数据捕获。”
“我们真的希望Cosmos能为机器人和工业人工智能领域做出贡献,就像Llama 3(Meta公司发布的大语言模型)为企业人工智能所做的那样。”黄仁勋表示。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司