在「犯罪」的道路上,人類可能是無師自通的。
ChatGPT 火了,下一秒就有學生拿它來做作業、寫論文,你很難說這到底是作弊還是剽竊。
老師很難确定學生的作業都出自自己之手,而人類也無法确定工具的最終形态到底是什麼。
面對成本低、效率高的 AI 文字生成工具,僅靠人類的智慧已經很難進行分辨。最頂尖的人工智能公司從「師夷長技以制夷」中學到的經驗也用在了這裡——它們要用 AI 識别 AI。
以 AI 治 AI,它們出手了
OpenAI 是近年風頭最勁的人工智能研究室。過去一年你看到的文字生成視頻、文字生成圖像都有它的身影,ChatGPT 也是它的得意之作。
基本每個月都會發布震驚業界成果的 OpenAI,剛發布的新産品卻是一個 AI 内容檢測器。
這個檢測器目前隻能應用于文字内容,争議和批評更多的圖像則不在此列。檢測器唯一的功能就是從人工智能的角度替你進行判斷,看看這段文字是不是人工智能生成的。
目前,隻有美國地區的用戶可以體驗這個檢測器的功能,檢測器本身也對檢測文本進行了一定的限制:
英文文本,檢測器和 ChatGPT 在英文外其他語言表現不佳。
需要 1000 個字符,大約 150-250 個左右的單詞才能生成更可信的結果。
檢測器在兒童撰寫的文本内容上同樣表現不佳,檢測器主要針對成人英文文本進行訓練。
最終檢測器會在完成判斷後給出「很可能、可能、不清楚、不可能、非常不可能」5 種答案。
這個檢測器從目前來看也不太聰明。在測試中,有文章末尾顯示「本文全文由 ChatGPT 撰寫」的内容,檢測器仍表示「不清楚」這篇文章是否由人工智能撰寫。
這也是檢測器目前尚無法從理解文本上進行判别的「證據」之一。
檢測器的出現象征意義比實際意義更大,這說明知名的人工智能實驗室們依舊在乎内容的真實。
畢竟從 ChatGPT 誕生開始,學校的老師就開始擔心學生的作業不再被認真對待,世界上最大的學術出版商聲明 ChatGPT 不能被記為作者,還有人擔心新技術變為欺詐的工具。
而現在,人工智能實驗室想努力辨别内容的創作來源,這本身就是好事。
即便你是創造者,安能辨我是 AI
好事之外,多的是壞消息。
因為這個檢測器的成功率有點慘不忍睹—— 26% 的準确率放在醫學領域屬于謀财害命一般的存在,就算放在運動領域預估運動員下一個動作能否得分的成功率都沒這麼低。
OpenAI 在發布這個工具時也承認了這一點。
它有時會「錯誤但自信地」将人類書寫的文本标記為人工智能創造的文本,尤其是當文本與訓練數據中的内容有較大差别時。
目前這個檢測器還很初級,甚至可以說這是一個「半成品」。
除了 OpenAI 自己提到的兒童内容和非英文内容,有點年頭的英文内容也很容易被誤判。
已經逝世的知名作家們的作品幾乎無一幸免,帶有時代特色的表達方式很容易被判定為 AI 作品。莎士比亞就慘遭毒手,他最短的悲劇《麥克白》就被判定為「該文本很可能是人工智能生成的。」
▲
莎士比亞的作品很可能是 AI 生成的
連創造者 OpenAI 都有點束手無策,辨别 AI 生成内容的道路依舊任重道遠。
當然這也很好理解,畫作相對文字還要更高門檻一些,通過筆觸、風格、水印,大家還能看出 AI 模仿學習的痕迹。
但文字沒有「水印」,大家用創作出的文字也非常多樣,因為創作者受教育的高低程度和表達風格,在最終文本上有較大差别也是可以理解的。
▲
AI 創造的内容越來越接近人 圖片來源:Midjourney
甚至可以這麼說,等 ChatGPT 再進一步,可能人類都無法判定這是否是人工智能生成的文本了。因為它就像身邊你我會寫出來的内容——沒有陌生的自創詞彙,不會前言不搭後語,内容言之有物。
如果人已經分辨不出内容的源頭了,那 AI 就成了未來的希望了。不管是用 AI 生成的内容自動加「水印」,還是檢測器經過多次叠代後正确率無限提高,AI 都是更好完成辨别的特殊角色。
除了創造者 OpenAI 在行動,還有不少學者、實驗室、大公司都在努力辨别 AI 内容。
一個叫做 Edward Tian 的學生創建了一個網站,想要「檢測 AI 剽竊」;Google 為了不在人工智能發展中掉隊,據稱将上架 6 個 AI 相關應用,其中就有檢測應用;抄襲檢測器 Turnitin 正在開發自己的 AI 生成文本檢測器。
當然,這都屬于未來,我們面臨的現狀是 AI 可以輕松制造大量内容,最終模糊信息源,而身為普通消費者的我們将很難辨别它的生産源頭。
AI 文本生成,輕易污染信息的模糊未來
還記得我們曾在《她在中文維基百科上胡編了上百萬字的古羅斯曆史,把俄羅斯人都騙了》寫的故事嗎?
一個高中畢業生靠着「一腔熱情」在維基百科上寫了幾百萬字的曆史内容,這些内容甚至流傳到了外網,被很多外網内容引用為來源。
如果将這個高中畢業生看作 AI,你就能懂 ChatGPT 的存在對信息可能造成怎樣的污染了。
這位高中生 3 年編了百萬字曆史,AI 的效率隻會比他更高。
他用三年生成的内容,随着 AI 的進步可能三天甚至三小時不到即可生成。更低的内容制作成本,AI 隻會做得更好,畢竟它本身就是在模仿學習,繼續模仿真實的曆史生成一段「曆史」并不難。
當然,AI 還沒有進化到《流浪地球 2》Moss 那樣的地步。它還沒有意識要去做這件事,有意識也不一定有意願去做這件事。但 AI 本身就是一種工具,就像用人用刀切菜做佳肴一樣,也可能有人持刀傷人。
千萬别說沒人這麼無聊,既然有人一字字都能編出百萬曆史,那門檻更低的 AI 内容會生成什麼故事、用于哪裡都是正常的。人類的多樣性總是超乎想象,當這種多樣碰上了 AI 的高效,信息被污染的情況隻會越來越多。
這還隻是 ChatGPT 剛出現幾個月後人們的想象。
在 ChatGPT 爆火的兩個月内,學生就已經自發用這種工具做作業、寫論文偷懶,編劇會用它編故事試試出乎人意料的故事走向;文案編輯用它來給自己打工。
在用工具給自己省事這件事上,人連教都不用教。
工具一旦離開工坊,被如何使用就不能由造工匠控制了。
要想影響工具的使用,要麼修改工具,要麼制造新的工具。
點擊「在看」
是對我們最大的鼓勵