当前位置:首页 > 科技资讯 > 为训练AI不择手段!Meta被曝下载数十TB盗版电子书

为训练AI不择手段!Meta被曝下载数十TB盗版电子书

2025-07-11 阅读 0
为训练AI不择手段!Meta被曝下载数十TB盗版电子书

快科技2月9日消息,据媒体报道,一名图书作者对Meta提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其AI模型。

最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包括数千万本盗版书籍

根据法庭文件,Meta通过名为“安娜的档案”(Anna'sArchive)的渠道下载了至少81.7TB的数据,其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容,Meta还被指此前从LibGen下载了额外的80.6TB数据。

作者指出,Meta的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。

作者估计,这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%,这表明Meta的盗版规模可能远超目前所揭露的。

邮件还显示,Meta公司员工也意识到其行为的法律风险,2023年4月,Meta的研究工程师尼古拉·巴什利科夫在邮件中表示:“用公司的笔记本电脑下BT感觉不妥。”

到2023年9月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用Torrents意味着对文件进行“播种”,即对外共享内容,这在法律上是不允许的。

但Meta仍决定继续,并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。

预约SEO专家添加微信号:xxxxxxx 领取免费VIP内部课程
© 著作权归作者所有
宏煊网络科技 作者
宏煊网络科技是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域
曾操作某大型门户网站日IP达100万(纯SEO流量),拥有上千网站提供SEO友情链接资源(参加培训免费赠送100个单向友情链接),免费赠送附子SEO内部VIP课程,2018年新版实战课程介绍