传OpenAI删除十万多本书,或为逃避AI模型训练版权费
最新解封的法庭文件显示,OpenAI删除了两个名为“图书1”(books1)和“图书2”(books2)的庞大数据集,这些数据集很可能包含“10万多本已出版书籍”,曾用于训练其GPT-3 AI模型。
事情的背景是,美国作家协会一直寻求从OpenAI获得有关这些数据集的信息,该协会指控OpenAI使用受版权保护的材料来训练AI模型。起初OpenAI以保密为由拒绝提供这些数据集的下落,但最近披露了已删除所有数据的副本,或为逃避版权费。
传OpenAI删除十万多本书,或为逃避AI模型训练版权费
最新解封的法庭文件显示,OpenAI删除了两个名为“图书1”(books1)和“图书2”(books2)的庞大数据集,这些数据集很可能包含“10万多本已出版书籍”,曾用于训练其GPT-3 AI模型。
事情的背景是,美国作家协会一直寻求从OpenAI获得有关这些数据集的信息,该协会指控OpenAI使用受版权保护的材料来训练AI模型。起初OpenAI以保密为由拒绝提供这些数据集的下落,但最近披露了已删除所有数据的副本,或为逃避版权费。