下载客户端

2.5亿美元！OpenAI打包新闻集团5年版权，用于大模型训练及问答

澎湃新闻记者秦盛

2024-05-23 10:54

来源：澎湃新闻

ChatGPT再扩容，这次将加入十余家媒体的新闻内容。

当地时间5月22日，OpenAI宣布与新闻集团（News Corp）达成多年期协议，将获得主要新闻和信息出版物的当前和存档内容，包括《华尔街日报》《巴伦周刊》《纽约邮报》《泰晤士报》《太阳报》等十余家媒体。

根据协议，OpenAI将能在ChatGPT中显示新闻集团旗下媒体的内容并用于回答用户的问题。同时，新闻集团将分享新闻专业知识，以帮助确保OpenAI的产品达到最高的新闻标准。

据外媒援引知情人士的话称，该交易为期五年，交易价值或超过2.5亿美元（约合人民币18.1亿元），包括现金形式以及使用OpenAI技术的信用额度。

此外，此次合作不包括访问新闻集团其他业务的内容。OpenAI表示，最终目标是让人们能够根据可靠的信息和新闻来源做出明智的选择。

OpenAI CEO山姆·奥特曼表示："我们与新闻集团的合作是新闻业和科技界引以为豪的时刻。我们非常珍视新闻集团作为全球突发新闻报道领导者的历史，并很高兴能加强用户对其高质量报道的访问。我们将共同为未来奠定基础，让人工智能深深地尊重、增强和维护世界级新闻报道的标准。”

此前，OpenAI已宣布和美国社交平台Reddit合作，可访问后者数据API（应用接口）的实时内容，并将内容引入ChatGPT等产品中。也与《金融时报》、美联社、《世界报》等多家媒体达成协议，授权使用资料库来训练AI（人工智能）模型。

但据外媒报道，上述与不同媒体合作的内容略有差别，例如美联社合作每年仅价值数百万美元，主要集中在将文本档案库内容用于培训。OpenAI与《金融时报》合作价值在每年500万-1000万美元，其中包括新闻内容的展示。

不过，OpenAI的版权合作之路也并不一帆风顺。《纽约时报》、The Intercept、《纽约每日新闻》等数十家媒体已提起版权侵权诉讼，指控OpenAI非法使用其新闻内容来培训AI（人工智能）模型。

对于使用公开的互联网材料训练AI模型，OpenAI表示，这种合理使用得到了长期存在，并有广泛的先例支持。这一原则对创造者公平，对创新者必要。尽管如此，公司还为出版商提供了一个简单的选择退出流程，以防止公司的工具访问纽约时报这样的网站。

OpenAI称，由于大模型是从人类知识的巨大集合中学习，因此任何一个部门都只是整体训练数据的一小部分，任何单一数据源，包括《纽约时报》，对于大模型的预期学习并不重要。

新闻集团旗下的《华尔街日报》指出，AI公司对出版商的内容如饥似渴，这些内容可以帮助完善模型，创建新产品，如AI驱动的搜索。出版商正在寻求确保能为使用自己的知识产权获得高额报酬，从而引发了整个行业复杂且有时甚至相当激烈的谈判。

根据外媒报道，在新闻集团与OpenAI达成的协议中，确保新闻内容不会在发布后立即在ChatGPT上提供。这是目前出版商们比较担忧的方面，即AI根据新闻内容提供完整的答案，用户无需登录新闻网站付费获取，出版商损失流量和广告收入。

外媒援引知情人士的说法称，OpenAI正寻求在回答内容的摘要下给出相关链接，让用户看到这些内容来源于哪些出版合作伙伴。

责任编辑：孙扶

图片编辑：陈飞燕

校对：丁晓

澎湃新闻报料：021-962866

澎湃新闻，未经授权不得转载

澎湃矩阵

新闻报料

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈

2.5亿美元 ！OpenAI打包新闻集团5年版权，用于大模型训练及问答