Meta被指用色情内容训练AI 索赔或超3.5亿美元

作者: CBISMB

责任编辑: 张金祥

来源: ISMB

时间: 2025-07-29 11:16

关键字: 人工智能,ChatGPT,创新,法学硕士,追踪,版权,政策

浏览: 874

点赞: 48

收藏: 64

多家美国色情视频制作公司近日向法院提起诉讼,指控Meta(原Facebook)母公司未经授权下载并使用其版权内容训练人工智能工具,涉及影片数量超2400部,潜在索赔金额或达3.59亿美元。这一事件再次将AI训练数据的合法性争议推向风口浪尖。

根据原告Strike 3 Holdings和Counterlife Media提交的26页诉讼文件,Meta自2018年起通过BitTorrent协议非法下载并分发了两家公司制作的约2400部色情影片。这些内容被用于训练Meta的AI视频生成工具“Meta Movie Gen”及旗下大型语言模型“Llama”。值得关注的是,此前已有书籍作者群体起诉Meta,指控其未经授权使用受版权保护的文字作品训练AI。

诉讼揭露,一名Meta员工通过互联网档案馆(Internet Archive)、Z-Library和Libgen等平台获取了近81.7TB的资料,涵盖大量可能受版权保护的内容。尽管Meta试图通过技术手段限制“种子传播”(即避免将下载数据提供给其他用户),但原告通过自研工具VXN Scan追踪到多个疑似来自Meta公司网络的IP地址,这些地址被指参与了侵权内容的下载与分发。原告使用Maxmind提供的数据库进一步验证了IP归属。

原告未明确具体索赔金额,但据科技媒体TorrentFreak估算,若按每部影片15万美元的常规赔偿标准计算,Meta可能面临总计约3.59亿美元(2400部×15万美元)的赔偿。不过,诉讼能否成立仍需证明VXN Scan等追踪工具的可靠性。值得注意的是,Strike 3此前多通过庭外和解解决类似纠纷,此次或延续这一策略。

截至目前,Meta尚未对诉讼作出公开回应。

自ChatGPT引发全球AI热潮以来,法院始终在界定AI公司使用受版权保护材料训练模型的边界。美国法律虽默认此类使用符合“合理使用条款”,但近期一起书籍作者诉AI公司Anthropic的案件中,法官明确裁定:若内容通过非法途径获取,则不适用合理使用原则。

此次Meta案的关键争议点在于:其是否明知或应知下载的色情内容涉及版权侵权,以及使用此类内容训练AI是否构成“合理使用”。若法院采纳Anthropic案的判决逻辑,Meta可能面临更严格的法律审查。

此次诉讼暴露了AI行业在数据获取环节的普遍风险。尽管Meta等科技巨头试图通过公开数据集(如互联网档案馆)规避版权问题,但若数据包含未经授权的版权内容,仍可能引发法律纠纷。分析认为,随着各国对AI监管趋严,企业需建立更严格的数据筛选与授权机制,避免重蹈Meta覆辙。