本文來自微信公衆号:阿茶的 AI 之路,作者:起名賊費勁的阿茶,題圖來自:AI 生成
一、小說:《機器腔症調查報告》
最近,出現了一系列描述降臨到語言共和國的奇特現象的報道。它們相互之間有很大出入,講述了不少令人難以置信的事情。而這些居民,都患上了一種被稱爲 " 機器腔症 " 的精神疾病。
語言共和國是十年前建立的一個以文化創意産業爲主的國家。然而,自從生成式人工智能普及後,一切都改變了。
最初的病例出現在首都 " 筆尖城 " 的一位知名作家身上。這位以風格獨特聞名的作家突然停止了更新,并在社交媒體上發表了一篇自白。
" 我承認自己一直在使用 AI 輔助寫作,一開始隻是用它提供靈感和建議。但最近重讀自己的文章時,我感到一陣恐懼 ——那些整齊的段落層次, ‘首先’、‘其次’的過渡詞,還有每段必用的‘因此’和結尾的‘總的來說’,都讓我覺得不寒而栗。這些文字的結構統一而單調,哪怕是我自己都分不清到底哪些是我寫的,哪些是 AI 生成的了。"
起初人們以爲這隻是一個作家對 AI 的過度依賴導緻的創作危機,但很快,類似的症狀在整個城市蔓延開來。
患者們表現出對特定表達方式的極度恐懼。他們開始本能地回避 " 首先 "、" 其次 "、" 總的來說 " 等詞語,因爲這些詞語已經被 AI 寫作軟件過度使用,成爲了機器生成内容的某種标記。
一位普通上班族在社交媒體上寫道:
" 每次寫工作郵件,我都要反複修改。那些常用的總結語,那些工整的段落,都讓我感覺自己不是在表達,而是在按照某種模式在輸出。這種感覺很可怕,仿佛我正在把自己變成一個 AI。"
特别值得注意的是,這種病症的發展與互聯網上 AI 生成内容的激增密切相關。随着各類 AI 寫作助手以及智能總結的普及,人們開始對某些特定的表達方式産生一種奇特的敏感。
" 這種敏感幾乎是潛意識的。" 一位匿名的文學教授解釋說," 當你在網上讀了成千上萬篇 AI 生成的文章後,你會開始本能地識别那些‘ AI 味’。每當拿到一篇新文章的時候,都會快速翻到最後一段,看開頭是否是‘總的來說’。那些‘首先 ...... 其次 ..... 結論’整齊劃一的行文方式,還有每一項都按點分類,那些過分工整的邏輯關系,都會讓你感到一種說不出的違和感。"
在筆尖城的一家心理診所的病例中,記錄了一位患者的自述:
" 每當我寫下‘因此’、‘總的來說’這樣的詞,我就會感到一陣惡寒。這些詞沒有問題,但它們讓我的文章看起來像是大語言模型寫的。我甯願用更随意的表達方式,比如用一個表情符号,或者簡單地換一個段落。"
這種症狀并非如早期報道所說那樣誇張。患者們并非完全拒絕書面表達,而是對某些特定的表達方式産生了應激反應。他們仍然在寫作,隻是變得更加随意,更傾向于使用口語化、帶有個人特色的表達方式。
到了疾病爆發的第二個月,這種現象開始影響到社會生活的方方面面。公司的報告變得越來越口語化,學術論文開始出現大量意想不到的比喻,甚至連政府文件都開始出現一些刻意爲之的不規範表達。
筆尖城的市長試圖通過發起 " 自然表達運動 " 來緩解這種恐慌,但收效甚微。在新聞發布會上,新聞稿被指責 " 像是 AI 寫的 ",最終市長不得不臨時改用即興演講的方式。
最令人不安的是,這種症狀似乎具有某種傳染性。僅僅通過長期浸潤在 AI 文本中,人們就可能逐漸産生類似的反應。據統計,目前全球已有數百萬人出現了不同程度的 " 機器腔症 "。
世界衛生組織的專家們對此表示擔憂。一位匿名專家說:" 這可能是人工智能時代給人類帶來的普遍性的語言表達障礙。它正在潛移默化地改變人們的日常交流方式。"
在筆尖城的一家咖啡館牆上,我們看到了一行小字:" 在這個 AI 無處不在的時代,保持自然随意的表達方式,或許才是最珍貴的 "。這或許是對這場正在發生的語言危機最好的注解。
——《語言共和國晚報》特約記者 阿茶
二、後記:AI 時代的語言焦慮
我感覺我逐漸被大語言模型剝奪了用詞的權利。有一些詞,似乎成爲了大模型的專屬。
比如 " 總的來說 "。當看到這個詞的時候,我會下意識懷疑這篇文章是不是 AI 寫的。這種邏輯清晰的表達在大模型出現之前,被當做是有條理的表現,現在爲什麽卻開始讓我覺得莫名的抗拒?
大語言模型并不隻是語言的學習者,它也在悄然成爲語言的塑造者。這種趨同化過程是無聲無息的。随着 AI 寫作的普及,各種各樣 AI 生産的内容已經鋪天蓋地進入人類世界,生産效率遠超人類的效率。當我打開 Edge 浏覽器首頁的時候,發現裏面可能有一半的文章都是 AI 寫的。當我查看微信公衆号推薦時,結構一緻的文章越來越多。很多文章的結構都是分點描述但十分空洞,評價模棱兩可,似乎是在隔靴搔癢。而拉到文章最後,往往也會有一個總結段落。這個時候我才反應過來:" 哦,這是大模型寫的。"
我在上周閱讀了一篇論文:《A linguistic analysis of undesirable outcomes in the era of generative AI》,講的是一個并不算新鮮的話題:使用合成數據訓練模型,會造成模型的崩壞。比如語言趨于單調,更重的模型幻覺 ...... 但是我想到,人類本質上也是一個在不斷學習進化的過程。如果把這些 AI 生産的數據扔到人類社會,我們每個人相當于一個可以學習的參數。是不是也相當于在用合成數據去訓練人類群體呢?用詞逐漸單調匮乏而趨于一緻,因爲我們都在用 AI 助手輔助寫作,輔助頭腦風暴 .......
随着 AI 原創或改寫的文章越來越多,它與真實語言的分布偏差,很有可能會改變人類的語言習慣。那些我們原有的屬于人類的," 不夠精準 " 的語言表達習慣,可能會在未來的五年、十年内被潛移默化地改掉。就像這篇論文的圖。随着訓練的叠代,依賴合成數據訓練的模型變得越來越單調。
或許我們的語言正在經曆一場無形的重構。
2024.11.18
阿茶
本文來自微信公衆号:阿茶的 AI 之路,作者:起名賊費勁的阿茶