微软通过 GitHub Copilot 起诉开源盗版

admin 2022年11月7日22:07:10评论53 views字数 1356阅读4分31秒阅读模式

©网络研究院

微软通过 GitHub Copilot 起诉开源盗版

程序员兼律师 Matthew Butterick 已起诉微软、GitHub 和 OpenAI,指控 GitHub 的 Copilot 违反了开源许可条款并侵犯了程序员的权利。

GitHub Copilot 于 2022 年 6 月发布,是一款基于 AI 的编程辅助工具,使用 OpenAI Codex 在 Visual Studio 中生成实时源代码和功能推荐。

该工具使用来自公共存储库的数十亿行代码进行了机器学习训练,可以将自然语言转换为数十种编程语言的代码片段。

删除作者

虽然 Copilot 可以加快编写代码的过程并简化软件开发,但它对公共开源代码的使用让专家担心它违反了许可归属和限制。

开源许可证,如 GPL、Apache 和 MIT 许可证,要求注明作者姓名并定义特定版权。

但是,Copilot 正在删除此组件,即使片段长度超过 150 个字符并直接取自训练集, 也不会给出任何归属。

一些程序员甚至将这种 开源洗钱称为“开源洗钱”,而这种方法的 法律含义 在 AI 工具推出后得到了证明。

微软通过 GitHub Copilot 起诉开源盗版

“似乎微软无视基础开源许可证的条件和其他法律要求,从他人的工作中获利,”诉讼中代表 Butterick 的律师事务所Joseph Saveri 评论道。
更糟糕的是,人们报告了Copilot 泄露在公共存储库上错误地发布的秘密的案例,因此包括在训练集中,例如 API 密钥。
除了违反许可证外,Butterick 还声称开发功能违反了以下内容:
  • GitHub 的服务条款和隐私政策,
  • DMCA 1202,禁止删除版权管理信息,
  • 加州消费者隐私法,
  • 以及引起相关法律索赔的其他法律。
投诉已提交给美国加州北区地方法院,要求批准 9,000,000,000 美元的法定赔偿金。
“每次 Copilot 提供非法输出时,它都会三次违反第 1202 条(分发许可材料时没有:(1)署名,(2)版权声明,和(3)许可条款),”投诉中写道。
“因此,如果每个用户在使用 Copilot 的整个过程中只收到一个违反第 1202 节的输出(最早采用者最多十五个月),那么 GitHub 和 OpenAI 违反了 DMCA 3,600,000 次。每次违规的最低法定损失为 2500 美元,这相当于 9,000,000,000 美元。”

危害开源


Butterick 在 10 月初的一篇博客文章中还谈到了另一个主题,讨论了 Copilot 可能给开源社区带来的损害。


这位程序员认为,通过向人们提供代码片段并且从不告诉他们谁创建了他们正在使用的代码,基本上消除了对开源贡献和协作的激励。


“微软正在创建一个新的围墙花园,它将阻止程序员发现传统的开源社区,” Butterick 写道。


“随着时间的推移,这个过程将使这些社区挨饿。用户的注意力和参与度将转移到 [...] 远离开源项目本身——远离他们的源代码库、他们的问题跟踪器、他们的邮件列表、他们的讨论板。"
Butterick 担心,如果有足够的时间,Copilot 会导致开源社区衰落,进而导致训练数据中代码的质量下降。
BleepingComputer 已联系微软和 GitHub 就上述问题发表评论,我们收到了来自 GitHub 的以下声明。
“我们从一开始就致力于通过 Copilot 进行负责任的创新,并将继续改进产品,以便为全球开发人员提供最佳服务。” - GitHub。

原文始发于微信公众号(网络研究院):微软通过 GitHub Copilot 起诉开源盗版

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2022年11月7日22:07:10
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   微软通过 GitHub Copilot 起诉开源盗版http://cn-sec.com/archives/1394634.html

发表评论

匿名网友 填写信息