澎湃Logo
下载客户端

登录

  • +1
杰弗里·辛顿:人类反馈强化学习是垃圾,就像靠刷漆来修旧车

杰弗里·辛顿:人类反馈强化学习是垃圾,就像靠刷漆来修旧车

2024-07-04 06:58
来源:澎湃新闻
奇客解>

在近日的一次访谈中,“AI教父”杰弗里·辛顿表示,“人类反馈强化学习(RLHF)是垃圾,就像靠刷漆来修旧车,我们在设计软件时就应该确保有更合理的维护方式。”

胡逸璠
责任编辑:卢雁
+1
收藏
          查看更多

          扫码下载澎湃新闻客户端

          沪ICP备14003370号

          沪公网安备31010602000299号

          互联网新闻信息服务许可证:31120170006

          增值电信业务经营许可证:沪B2-2017116

          © 2014-2024 上海东方报业有限公司

          反馈