Training generative AI models requires extensive amounts of data. A common practice is to collect such data through web scraping. Yet, much of what has been and is collected is copyright protected. Its use may be copyright infringement. In the USA, AI developers rely on "fair use" and in Europe, the prevailing view is that the exception for "Text and Data Mining" (TDM) applies. In a recent interdisciplinary tandem-study, we have argued in detail that this is actually not the case because generative AI training fundamentally differs from TDM. In this article, we share our main findings and the implications for both public and corporate research on generative models. We further discuss how the phenomenon of training data memorization leads to copyright issues independently from the "fair use" and TDM exceptions. Finally, we outline how the ISMIR could contribute to the ongoing discussion about fair practices with respect to generative AI that satisfy all stakeholders.


翻译:训练生成式人工智能模型需要大量数据。通常的做法是通过网络爬虫收集此类数据。然而,已收集和正在收集的数据大多受版权保护。其使用可能构成版权侵权。在美国,人工智能开发者依赖“合理使用”原则;而在欧洲,主流观点认为“文本与数据挖掘”(TDM)例外条款适用。在近期一项跨学科串联研究中,我们详细论证了实际情况并非如此,因为生成式人工智能训练在根本上不同于TDM。本文中,我们分享了主要研究发现及其对生成式模型的公共研究和企业研究的影响。我们进一步探讨了训练数据记忆现象如何独立于“合理使用”和TDM例外条款引发版权问题。最后,我们概述了国际音乐信息检索学会(ISMIR)如何为推动关于满足所有利益相关者需求的生成式人工智能公平实践的持续讨论作出贡献。

0
下载
关闭预览

相关内容

《生成式人工智能教学指南​》美空军技术学院最新377页
【新书】生成式人工智能:概念与应用
专知会员服务
47+阅读 · 2025年3月18日
【新书】合成数据与生成式人工智能
专知会员服务
47+阅读 · 2025年2月9日
【新书】生成式人工智能模型,419页pdf
专知会员服务
121+阅读 · 2024年9月3日
《生成式人工智能模型:机遇与风险》
专知会员服务
78+阅读 · 2024年4月22日
生成式人工智能预训练和优化训练数据安全规范
专知会员服务
49+阅读 · 2024年4月11日
视频生成的前沿论文,看我们推荐的7篇就够了
人工智能前沿讲习班
34+阅读 · 2018年12月30日
基于深度学习的文本生成【附217页PPT下载】
专知
35+阅读 · 2018年11月24日
AI 经典书单 | 人工智能学习该读哪些书
七月在线实验室
35+阅读 · 2018年1月16日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
VIP会员
最新内容
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
人工智能如何变革军事C5ISR作战
专知会员服务
12+阅读 · 5月8日
相关VIP内容
《生成式人工智能教学指南​》美空军技术学院最新377页
【新书】生成式人工智能:概念与应用
专知会员服务
47+阅读 · 2025年3月18日
【新书】合成数据与生成式人工智能
专知会员服务
47+阅读 · 2025年2月9日
【新书】生成式人工智能模型,419页pdf
专知会员服务
121+阅读 · 2024年9月3日
《生成式人工智能模型:机遇与风险》
专知会员服务
78+阅读 · 2024年4月22日
生成式人工智能预训练和优化训练数据安全规范
专知会员服务
49+阅读 · 2024年4月11日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员