在周四提交的一份经过大量删改的法庭文件中,《纽约时报》提议修改其对 OpenAI 和微软的版权诉讼,以澄清一项指控,并指控微软通过构建一台跻身全球最强大行列的定制超级计算系统,积极鼓励 OpenAI 窃取《纽约时报》的作品。
《纽约时报》提出动议之前,最高法院在一起案件中支持了 Cox Communications,该案中索尼试图指控 Cox 作为互联网服务提供商助长了音乐盗版行为但未获支持,这为帮助侵权(contributory infringement)设定了新标准。今后,原告必须证明当事人故意采取行动诱导了非法行为。认识到法律先例已发生变化,《纽约时报》现在希望修改其诉状,使其针对微软的帮助侵权指控符合这一新标准。
“今天,我们请求法院允许提交一份经修改的诉状,以进一步加强我们的案件,基于新法律以及在证据开示期间发现的新证据,澄清我们对微软帮助侵权的指控,”《纽约时报》发言人 Graham James 在一份提供给 Ars 的声明中表示。
除了澄清一项指控外,《纽约时报》还同意自愿撤销对全体被告的两项帮助版权侵权和商标淡化的指控。
微软的一位发言人告诉 Ars,该公司认为这份修改后的诉状是“原告为挽救其指控免受最近其他裁决中不利先例影响而采取的最后一搏”。
但在其动议中,《纽约时报》辩称,允许修改诉状既不会对微软也不会对 OpenAI 造成损害。《纽约时报》认为,当法律标准发生变化时,允许原告修改论点是恰当的,并且案件时间表不会因此推迟,因为“《时报》不寻求为支持其修改后的指控而进行任何额外的证据开示”。
“正如我们长期以来所指控的那样,微软积极鼓励 OpenAI 窃取我们的受版权保护作品,”詹姆斯表示。“除了修正该项指控并将案件精简为其最强有力的论据之外,我们的核心主张自提起诉讼之日起始终未变——即微软和 OpenAI 窃取了《纽约时报》数百万篇受版权保护的作品,用以与我们的产品竞争并非法牟利。”
《纽约时报》将矛头指向微软超级计算机
2023 年,《纽约时报》成为首家起诉 OpenAI 的大型出版商。这家知名报业指控 ChatGPT 非法使用其文章进行训练,通过逐字输出文章侵犯其版权,通过将 ChatGPT 定位为《纽约时报》订阅的替代品造成市场损害,以及通过将不实主张归咎于《纽约时报》报道造成声誉损害。此外,《纽约时报》还指控,ChatGPT 输出对 Wirecutter 评测的摘要,导致作者因联盟链接点击量损失而失去佣金。
在最初的诉状中,《纽约时报》将微软的超级计算系统描述为似乎只是提供通用云计算服务。更新后的诉状试图明确该超级计算机是为帮助 OpenAI 侵权而量身定制的,并指控其是为在未经许可的情况下将 AI 训练于受版权保护作品而专门建造的。而且据《纽约时报》指控,该系统的训练中更重地加权了其文章,因为两家公司都希望尽可能利用最高质量的新闻内容来训练模型,从而让输出的内容能够自信地模仿那种写作水平。
《纽约时报》指控,通过建造这台“异常复杂”的机器,微软不仅协助筛选出被侵权的作品,还提供了未经许可获取受版权保护作品的手段。
“微软专门设计该机器,目的是利用几乎整个互联网——并特意调整使其不成比例地以《纽约时报》作品为特色——来训练史上最强大的大语言模型,”《纽约时报》指控道。
而现在,它被指控不正当地获利。
“微软将基于《纽约时报》作品训练的大语言模型部署到其整个产品线中,仅在过去一年就帮助其市值增加了 1 万亿美元,”《纽约时报》指控道。
《纽约时报》指控,模型输出显示出市场损害
在证据开示阶段分享的输出内容中,对《纽约时报》而言,最具说服力的证据之一依然包括大量用户的 ChatGPT 会话记录——这些记录表明,OpenAI 和微软构建的工具 allegedly 通过生成与《纽约时报》受版权保护作品几乎逐字逐句的摘录,取代了《纽约时报》的地位。
在某些情况下,用户告诉 ChatGPT 他们正试图绕过付费墙,并通过要求查看“下一段”来获取文章的大段内容。在其他情况下,“模型只是直接吐出好几段文字”,根本不需要这样费尽周折。为了证明替代效应造成的市场损害,他们在投诉中分享了并排对比的示例,以及 alleged 侵权输出内容的截图: