- +1
杰弗里·辛顿:人类反馈强化学习是垃圾,就像靠刷漆来修旧车
在近日的一次访谈中,“AI教父”杰弗里·辛顿表示,“人类反馈强化学习(RLHF)是垃圾,就像靠刷漆来修旧车,我们在设计软件时就应该确保有更合理的维护方式。”
胡逸璠
责任编辑:卢雁
+1
收藏
查看更多
澎湃矩阵
新闻报料
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司
反馈