近400家美国报纸起诉微软和OpenAI:未经授权抓取新闻内容训练AI
阅读原文· ithome.com近400家报纸集体起诉是迄今为止最大的AI版权诉讼,结果可能决定新闻数据在训练中的合法性边界,媒体和AI公司都该盯着。
代表近400家纸媒的出版商联盟向美国纽约南区联邦地区法院起诉微软和OpenAI,指控其未经授权抓取新闻内容用于训练Copilot、ChatGPT等AI模型,侵犯版权并触犯《数字千年版权法》。起诉书称被告“系统性且秘密地”爬取网站,复制文章并删除版权管理信息。原告表示AI产品基于其内容创造数十亿美元价值,但出版商分文未得,称此举或成地方新闻业“丧钟”。OpenAI回应训练数据基于公开可获取内容且符合合理使用原则,微软未置评。
IT之家 6 月 26 日消息,彭博社最新披露一份 6 月 24 日公示的美国法院文件,代表近 400 家纸媒的出版商联盟指控微软和 OpenAI 公司,称其未经许可抓取网站内容用于训练 AI。
该联盟于本周三向美国纽约南区联邦地区法院提起诉讼,指控微软和 OpenAI 两家公司未经授权抓取新闻内容,用于训练 Copilot 和 ChatGPT 等 AI 背后模型,涉嫌侵犯版权,并触犯《数字千年版权法》。
起诉书称,被告“系统性且秘密地”爬取出版商的网站,并将文章、故事和其他原创作品复制到自己的服务器上,用它们来训练大型语言模型,同时从作品中删除版权管理信息。
原告表示,这些生成式人工智能产品建立在出版商长期投入的内容之上,却为被告带来数十亿美元市场价值,而出版商“1 分钱都没拿到”。原告同时强调,若 AI 公司滥用新闻内容而不承担责任,本轮 AI 热潮可能成为地方新闻业的“丧钟”。
代表原告的新泽西州前总检察长马修 · 普拉特金(民主党)在接受采访时表示,这起诉讼是地方和区域报纸发起的最大规模的法律行动。
OpenAI 发言人 Drew Pusateri 回应称,公司模型推动创新,训练所用数据来自公开可获得的数据,并以合理使用为基础。微软方面未立即回应媒体置评请求。