GitHub 在去年 11 月遭到集體訴訟。
現在,關于其背後的知識共享問題被翻出來,美國版權清理中心(CCC)的常務董事 Roy Kaufman 特地撰文指出:
GitHub 給的代碼通常沒有署名,違反了著作權授權許可協議 CC BY 4.0。
此文一出,GitHub 再度被推到風口浪尖,引起熱烈讨論。
這場起訴的導火索是 GitHub 與 OpenAI 共同研發的 " 敲代碼神器 ":Copilot。
當時,正式發布不到 5 個月的 Copilot 已惹怒了一衆程序員,主要問題可以概括為" 侵權 "二字。
知識共享問題再度引熱議
美國版權清理中心的 Roy 在文中寫道,其實 CC BY 4.0 的規定已經算相當寬松了:
隻要有合理的署名,就可以在沒有額外許可的情況下,把用戶上傳的内容用于文本數據挖掘、機器學習,以及 AI 訓練(可統稱為 Text Data Mining,TDM)。
巴特,GitHub Copilot 給出的代碼連這點都做不到——因為它往往沒有标注作者署名。
誠然,GitHub 主要是個用于分享開源代碼的平台,但官方這樣随意挪用用戶上傳的内容,依然涉嫌違反許多法律和協議。
有網友指出:
(根據相關法律),不可以通過修改主機服務商的使用條款,随意挪用用戶上傳的内容。
還有人把 Copilot 和谷歌圖書(Google Books)作比較,後者用于搜索谷歌掃描的書籍、雜志全文,并可通過光學字符識别(OCR)轉換為文本。該網友指出:
二者有一個明顯的不同之處:谷歌圖書一次隻允許你訪問 2 頁内容。
若要獲取一本書的全部内容,必須搜索很多次——也就是說,他人不能一下子就獲得這本書的完整電子版,這樣就不存在 " 版權清洗 "。
事實上,谷歌圖書也曾被作家協會起訴,但人家谷歌最後勝訴了。
因為法院在權衡版權侵權問題時,會考慮 " 實用性 " 以及 " 充分改造性 " 等問題。
有吃瓜網友補充調侃道,雖然谷歌很有可能把這些電子版書籍的内容上傳到自家的雲上了,但是:
畢竟人家沒用這些東西來搞 AI 寫小說。
言外之意,就是假如谷歌來搞類似 Copilot 的事情,那他們可能也要面臨大麻煩。
違反多項法律和協議
至于 GitHub Copilot 違反了哪些協議,原告表示,其中包括美國的數字千年版權法(Digital Millennium Copyright Act,DMCA)。
DMCA 主要有以下部分:
版權技術措施法案(Copyright Technical Measures Act):規定在數字領域中可使用的技術保護措施,防止未經許可被挪用。
網絡服務提供商責任限制法案(Online Copyright Infringement Liability Limitation Act):規定網絡服務提供商(如網站或雲服務)在用戶侵權行為方面的責任。
對破解加密技術的刑事處罰條例(Criminal Penalties for Circumvention of Encryption Measures):破解加密技術,可能構成刑事犯罪。
版權投訴通知制度(Copyright Complaint Notification System):規定版權所有者如何投訴侵權行為,以及網絡服務提供商應對投訴的責任和義務。
據其中的 " 網絡服務提供商責任限制法案 ",如果服務商希望使用用戶上傳内容,需征得用戶同意,并且在使用時給予适當的署名。(嗯,又是署名 ...)
除了 DMCA,Copilot 還涉嫌違反了加州消費者隐私法等,以及前文提到的 CC BY 4.0。
總而言之,GitHub 和 Copilot 涉嫌違反的法律和規定相當錯綜複雜。
目前,本案尚處于早期階段,不管最終判決結果如何,都還有很長的路要走。
值得一提的是,訴訟發起者,幹了 20 多年的老程序員 Matthew Butterrick 已激活了自己的律師資格證,特地來細究這些問題。
參考鍊接:
[ 1 ] https://scholarlykitchen.sspnet.org/2023/01/05/github-is-sued-and-we-may-learn-something-about-creative-commons-licensing/
[ 2 ] https://news.ycombinator.com/item?id=34274326