《纽约时报》对OpenAI的诉讼可能对机器智能的发展产生重大影响

 4个月前     138  
《纽约时报》对OpenAI的诉讼可能对机器智能的发展产生重大影响

文章目录

《纽约时报》对OpenAI的诉讼可能对机器智能的发展产生重大影响

1954年,《卫报》的科学记者报道了“电子大脑”,它有一种记忆形式,可以让他们在几秒钟内检索信息,比如航空公司的座位分配

如今,计算机存储信息的想法如此普遍,以至于我们甚至都不想“内存”这样的词到底是什么意思。然而,早在20世纪50年代,这种语言对大多数人来说都是新的,“电子大脑”的想法充满了可能性

2024年,你的微波比20世纪50年代被称为大脑的任何东西都更有计算能力,但人工智能世界正在给语言和律师带来新的挑战。上个月,《纽约时报》对流行的基于人工智能的文本生成工具ChatGPT的所有者OpenAI和微软提起诉讼,指控他们在训练(改进)和测试系统所用的数据中使用了《泰晤士报》的文章

他们声称OpenAI在创建ChatGPT的过程中使用他们的新闻报道侵犯了版权。诉讼称,通过这样做,他们创造了一种威胁其业务的竞争产品。到目前为止,OpenAI的回应非常谨慎,但该公司发布的一份声明中概述的一个关键原则是,他们对在线数据的使用属于“合理使用”原则。OpenAI认为,这是因为他们在这个过程中将作品转化为新的东西——由ChatGPT生成的文本

这个问题的关键是数据使用问题。像OpenAI这样的公司有权使用哪些数据,“转换”等概念在这些背景下到底意味着什么?像这样的问题,围绕着我们训练人工智能系统或ChatGPT等模型的数据,仍然是一个激烈的学术战场。法律往往落后于行业行为

如果你曾使用人工智能为你回复电子邮件或总结工作,你可能会将ChatGPT视为证明手段合理性的目的。然而,如果实现这一目标的唯一途径是豁免特定的公司实体遵守适用于其他所有人的法律,我们或许应该担心

这不仅可以改变围绕这类版权诉讼的辩论的性质,而且有可能改变社会构建法律体系的方式

基本问题

这样的案例可能会引发关于法律系统未来的棘手问题,但也可能会质疑人工智能模型本身的未来。《纽约时报》认为,ChatGPT威胁到该报的长期生存。关于这一点,OpenAI在声明中表示,它正在与新闻机构合作,为新闻业提供新的机会。该公司表示,公司的目标是“支持健康的新闻生态系统”和“成为好的合作伙伴”

即使我们相信人工智能系统是我们社会未来的必要组成部分,破坏它们最初训练的数据来源似乎也是一个坏主意。这是《纽约时报》、乔治·R·R·马丁等作家以及在线百科全书维基百科等创造性努力共同关心的问题

大规模数据收集的倡导者认为,人工智能系统通过从数据集中“学习”,然后创建新的东西,来“转换”他们训练的数据

实际上,他们的意思是研究人员提供人们编写的数据,并要求这些系统猜测句子中的下一个单词,就像他们在处理用户的真实问题时一样。通过隐藏然后揭示这些答案,研究人员可以提供一个二进制的“是”或“否”答案,帮助人工智能系统实现准确的预测。正是因为这个原因,LLM需要大量的书面文本

如果我们从《纽约时报》网站上复制文章并向人们收取访问费,大多数人会同意这将是“大规模的系统性盗窃”(正如该报的诉讼所说)。但是,如上所示,通过使用数据来指导人工智能来提高其准确性比这更复杂

像OpenAI这样的公司不存储他们的训练数据,因此认为《纽约时报》提供给数据集的文章实际上没有被重用。然而,对人工智能辩护的一个反驳是,有证据表明,ChatGPT等系统可以“泄露”其训练数据的逐字摘录。OpenAI表示,这是一个“罕见的错误”

然而,这表明这些系统确实存储和记忆了他们训练的一些数据——无意中——并且可以在以特定方式提示时逐字逐句地将其反噬。这将绕过营利性出版物为保护其知识产权而设立的任何付费墙

语言使用

但在这种情况下,可能对我们处理立法的方式产生长期影响的是我们对语言的使用。大多数人工智能研究人员会告诉你,用“学习”这个词来描述人工智能实际在做什么是一个非常沉重和不准确的词

随着社会向人工智能时代的大规模转变,必须问的问题是,当前形式的法律是否足以保护和支持人们。某些东西是否以不同于原始作品的方式建立在现有受版权保护的作品上,被称为“变革性使用”,是OpenAI使用的一种辩护

然而,这些法律旨在鼓励人们对已经发布到外部世界的作品进行混音、重组和实验。同样的法律并不是为了保护价值数十亿美元的技术产品,这些产品的工作速度和规模比任何人类作家所期望的都高出许多数量级。

大规模数据收集和使用的许多防御措施的问题在于,它们依赖于对英语的奇怪使用。

就像1954年一样,当人们看到现代等效的坏计算器并称其为“大脑”时,我们正在使用旧语言来处理全新的概念。无论我们怎么称呼它,像ChatGPT这样的系统都不像我们的大脑那样工作,人工智能系统在社会中也不像人们那样发挥作用。

正如我们在20世纪50年代必须开发新词和对技术的新共识来理解计算机一样,我们可能需要开发新的语言和新的法律来帮助在20世纪20年代保护我们的社会。

想要了解更多关于脑机接口技术的内容,请关注脑机网,我们将定期发布最新的研究成果和应用案例,让您第一时间了解脑机接口技术的最新进展。

版权声明:Robot 发表于 4个月前,共 2030 字。
转载请注明:《纽约时报》对OpenAI的诉讼可能对机器智能的发展产生重大影响 | 脑机网

您可能感兴趣的

暂无评论

暂无评论...