澎湃Logo
下载客户端

登录

  • +1

斯坦福大学Aloha团队出新作:“吼你牌”系统让机器人洗盘子更干净

澎湃新闻记者 喻琰 实习生 方卉
2024-04-09 16:28
来源:澎湃新闻
未来2% >
字号

·研发者称,希望未来的研究能进一步让机器人在自然形式的人类监督下不断进步,最终让任何人都能帮助教育机器人。

继家务机器人火爆全网后,近日,斯坦福大学研发Mobile Aloha团队又出新作——一款名为“Yell At Your Robot”(简称YAY Robot)的系统。有了这个系统,可以通过“喊话”来训练机器人。

利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。

目前,YAY Robot系统作为研究成果,已经在社交平台上公开,系统也已开源。

通过喊话训练机器人

根据论文介绍,YAY Robot系统是一个通过自然语言反馈,来改善机器人后期训练的系统。在传统方法训练机器人的过程中,研究人员需要观看机器人视频,并且要为每个技能片段、事后动作,进行重新标注或一次性纠正,过程非常费力费时。

为了简化这一过程,YAY Robot研发团队采用了一种更有效的数据收集方法:现场解说。通过在机器人附近放置麦克风,操作人员可以先用语言说出机器人需要掌握的技能,然后遥控机器人进行同步操作,录制的音频可以与机器人的轨迹同步。

经过训练后的YAY Robot可以在与用户的互动中不断改进,提升动作水平,即时调整策略,将语言更有机地融入机器人的学习过程中。研究人员表示,利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。比如,在“准备混合食物”这一任务中,经过喊话训练的机器人动作准确性提高了30%-45%、在“清洗盘子”任务中提高了15%-25%。尤其是在清洗盘子这项任务中,研究人员可以直观地看到整个盘子表面的清洁效果,通过人类的口头反馈经过微调之后的机器人清洁力度更强,范围也变大了。

通过人类的口头反馈经过微调之后的机器人清洁力度更强

YAY Robot还引入了实时语言纠正机制

YAY Robot系统是怎么做到的呢?

研发人员透露,整个YAY系统在架构上主要由高级策略和低级策略两个部分组成。其中高级策略负责通过自然语言指令控制低级策略,低级策略则用于执行具体动作。

YAYRobot系统工作机制

此外,YAY系统引入了实时的语言纠正机制。当机器人的操作行为不理想时,操作人员会对YAY Robot系统说,“我想让机器人稍微调整一下”,这些修正语言就会被记录包含在未来的训练数据收集中。

研究人员表明,YAY Robot的目标是通过不断学习,最大可能的减少修正的需要,并随着时间的推移,能与用户的偏好保持一致。

为了提高机器人操作任务的性能,研究人员透露,YAY Robot系统每次要进行 20 次试验,还对子任务的成功率进行测量。“我们的代码实现了采集数据与处理这一过程的自动化,并且已经开源。”研究人员在论文中称。

研究人员施露西在论文中展望,希望未来的研究能进一步让机器人在人类的监督下不断进步,最终让任何人都能帮助教育机器人。

YAY Robot研究成果第一作者施露西本科毕业于大学计算机科学专业,曾在英伟达研究院与朱玉珂教授和 Jim Fan 博士合作,2023年3月加入斯坦福大学切尔西·费恩(Chelsea Finn)实验室,同年8月受邀在谷歌DeepMind就AWE发表演讲。

    责任编辑:宦艳红
    校对:施鋆
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司

            反馈