澎湃Logo
下载客户端

登录

  • +1

OpenAI回应被纽约时报起诉:使用公开素材训练合理,单一数据源不重要

澎湃新闻记者 李潇潇
2024-01-09 09:32
来源:澎湃新闻
10%公司 >
字号

AI(人工智能)新锐巨头OpenAI再次回应被《纽约时报》起诉事宜。

当地时间1月8日,OpenAI通过官网发布一份声明称,《纽约时报》的诉讼毫无根据,且没有讲述完整的事实。

2023年12月27日,《纽约时报》以侵犯版权为由起诉OpenAI和微软,成为了第一家起诉这两家公司侵犯其文字作品版权的美国大型媒体。《纽约时报》指出,被告应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。此外,《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。

在最新的声明中,OpenAI认为《纽约时报》并未讲述全部的事实。OpenAI提到,通过2023年12月19日的最后一次沟通,公司与《纽约时报》的讨论似乎取得了建设性进展,但纽约时报12月27日提起诉讼,令公司感到惊讶和失望。

此次声明并非OpenAI第一次公开回应被起诉事宜。当地时间1月4日,OpenAI的知识产权和内容首席汤姆·鲁宾(Tom Rubin)曾在一个采访中回应被《纽约时报》起诉,称感到“惊讶”,因为在《纽约时报》起诉公司之前,双方正处于“非常积极和富有成效的谈判中”。

在最新的声明中,OpenAI还提到双方沟通的一个细节:《纽约时报》提到,看到了一些内容的反刍,公司承诺调查和解决这些问题,但一再拒绝分享任何示例。

OpenAI强调,《纽约时报》的诉讼毫无根据,尽管如此,公司仍然希望与其建立建设性的合作伙伴关系,并尊重其悠久的历史。关于与新闻机构的合作。OpenAI还提到,公司与数十家以及新闻/媒体联盟等行业组织联系沟通,以探索机会,讨论他们的担忧并提供解决方案,公司的目标是支持健康的新闻生态系统,成为良好的合作伙伴,创造互利的机会。

对于使用公开的互联网材料训练AI模型,OpenAI认为,这种合理使用得到了长期存在,并有广泛的先例支持。这一原则对创造者公平,对创新者必要。尽管如此,公司还为出版商提供了一个简单的选择退出流程,以防止公司的工具访问纽约时报这样的网站。

反刍(Regurgitation)是指特定内容在大模型的训练数据中多次出现。对此,OpenAI强调,这是一种罕见的失败,公司采取了措施来限制并非故意的记忆,并防止大模型输出中的反刍现象。同时,OpenAI强调,故意操纵其大模型进行反刍,并不是对技术的适当使用,也违反了使用条款。

“由于大模型是从人类知识的巨大集合中学习,因此任何一个部门都只是整体训练数据的一小部分,任何单一数据源,包括《纽约时报》,对于大模型的预期学习并不重要。”OpenAI表示。

    责任编辑:孙扶
    图片编辑:陈飞燕
    校对:栾梦
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈