近400家美国报纸起诉微软和OpenAI：未经授权抓取新闻内容训练AI

2026-06-26 12:37·13小时前

精选理由

近400家报纸集体起诉是迄今为止最大的AI版权诉讼，结果可能决定新闻数据在训练中的合法性边界，媒体和AI公司都该盯着。

AI 摘要

代表近400家纸媒的出版商联盟向美国纽约南区联邦地区法院起诉微软和OpenAI，指控其未经授权抓取新闻内容用于训练Copilot、ChatGPT等AI模型，侵犯版权并触犯《数字千年版权法》。起诉书称被告“系统性且秘密地”爬取网站，复制文章并删除版权管理信息。原告表示AI产品基于其内容创造数十亿美元价值，但出版商分文未得，称此举或成地方新闻业“丧钟”。OpenAI回应训练数据基于公开可获取内容且符合合理使用原则，微软未置评。

原文

IT之家 6 月 26 日消息，彭博社最新披露一份 6 月 24 日公示的美国法院文件，代表近 400 家纸媒的出版商联盟指控微软和 OpenAI 公司，称其未经许可抓取网站内容用于训练 AI。

该联盟于本周三向美国纽约南区联邦地区法院提起诉讼，指控微软和 OpenAI 两家公司未经授权抓取新闻内容，用于训练 Copilot 和 ChatGPT 等 AI 背后模型，涉嫌侵犯版权，并触犯《数字千年版权法》。

起诉书称，被告“系统性且秘密地”爬取出版商的网站，并将文章、故事和其他原创作品复制到自己的服务器上，用它们来训练大型语言模型，同时从作品中删除版权管理信息。

原告表示，这些生成式人工智能产品建立在出版商长期投入的内容之上，却为被告带来数十亿美元市场价值，而出版商“1 分钱都没拿到”。原告同时强调，若 AI 公司滥用新闻内容而不承担责任，本轮 AI 热潮可能成为地方新闻业的“丧钟”。

代表原告的新泽西州前总检察长马修 · 普拉特金（民主党）在接受采访时表示，这起诉讼是地方和区域报纸发起的最大规模的法律行动。

OpenAI 发言人 Drew Pusateri 回应称，公司模型推动创新，训练所用数据来自公开可获得的数据，并以合理使用为基础。微软方面未立即回应媒体置评请求。

MicrosoftOpenAI行业动态

IT之家（RSS）

精选74