财聯社 2 月 1 日訊(編輯 馬蘭)春節期間,一部《流浪地球 2》點燃了全民的科幻熱情,影片中的數字生命 " 圖丫丫 " 就仿佛是人工智能的投射,集中了人們對人工智能的所有期待。
而 OpenAI 去年年底發布的 ChatGPT 則讓不少國内投資人的科幻熱情得到了寄托,帶動人工智能一詞在 A 股市場持續刷屏。
很多人體驗完 ChatGPT 之後,将其誇的神乎其神,例如體驗感很真實,比目前通用的人工智能客服都更會 " 講人話 ",邏輯暢通,思路清晰 …… 仿佛是電影中數字生命的現實版本。
還有人更是憂心忡忡,ChatGPT 可以模仿人類寫詩甚至寫歌,用不了多久,人類大規模失業可能就會出現!
然而,多位人工智能界專家及其相關研究報告都在強調 ChatGPT 技術上所存在的壁壘,例如這一語言模型很難應用于精确或可信度要求高的工作之中。
這一缺點并不難在實探中得到印證。這既是該項技術未來可能進步的方向,也可能為商業化設想提供了 " 負面清單 "。
假如你是一名财經編輯
财聯社編輯在親身試用 ChatGPT 之後,讓她大舒一口氣的是:财經新聞還是得靠人來寫。
2020 年,OpenAI 曾在一篇論文中表示,其 GPT-3 生成的新聞文章樣本,讓人類很難識破是由機器生産的文章。
這一點讓人感到好奇,于是在近日實探中,我們向 ChatGPT 發送如下指令:請以一名專業的财經類主編身份點評一則報道。随之附上的是去年财聯社關于全球富豪排行變動的一條新聞。
不難發現,ChatGPT 的回答雖然有條有理,但頗為死闆,像是高中語文的閱讀理解。
此外,ChatGPT 還在另一次測試中出現了張冠李戴的問題,當輸入一篇短篇報道并要求 ChatGPT 進行擴寫時,不僅出現了原文中從未有過的材料,更是出現了數字謬誤。
文中紅線标劃之處都是 ChatGPT 的即興發揮,有關比爾蓋茨、李嘉誠包括此後對歐洲、亞洲富豪的叙述都是新産生的文本。而據調查,所謂比爾蓋茨在 2022 年減少 350 億美元身價,實際上應該為 290 億美元,350 億美元應該為他截至 2019 年累計捐贈的數額。
在另一個問題的測試中,ChatGPT 也坦誠了自己的局限。由于其儲存資料的時間限制在 2021 年前,所有 2022 年以後發生的事情其實在它的 " 大腦 " 裡都無法正确處理。
人工智能确實能夠生成一些幾能亂真的新聞報道,但背後卻仍需要人工對事實進行不斷的核查。僅從這個角度來看,ChatGPT 并沒有解放多少生産力。
而從其行文來看,其中并不帶很多的感染力,這也讓它在藝術創作方面無法與人類媲美。
這就讓這款人工智能有些進退兩難:若從事專業寫作,讀者不得不質疑其準确性;而從事藝術創作,它又沒有豐富的表現力。
一緻性問題
ChatGPT 是建立在 Instruction GPT(GPT-3 的分支模型)上的語言模型,依托于 Transformer 模型,與上一代 RNN 模型相比,在處理速度和多任務處理上實現革新。
ChatGPT 的語言模型在預訓練階段,被填鴨式塞進了過濾前容量達 45TB 的壓縮文本,且過濾後也有 570GB 的海量數據,然後再通過多次的舉一反三來增加準确率。
在 ChatGPT 的邏輯裡," 你 " 後面可以跟的字有不同的概率,可以是 " 你好 ",也可以是 " 你們 " 等等,它需要做的是,就是回溯上文來推導下一個字最可能跟哪一個字。
而以前的 RNN 模型則是通過标記海量的數據集,先教會人工智能什麼是對的,再讓其進行判斷。如果說 RNN 模型是嚴格按照原文做閱讀理解,那麼 GPT 則做到了完形填空。
這就使得以 Transformer 為基礎的人工智能可以通過旁征博引來跳出 " 輸入 " 的前提,這大大緩解了 " 教學壓力 "。
當然,帶來的後果也已經顯現:" 跳脫 " 的人工智能很可能用一個詞改變整個語境。
就如試驗中出現的馬斯克反轉。在原文隻給出馬斯克因收購推特而導緻特斯拉股票暴跌,并讓他自己财富縮水的線索時,ChatGPT 神來一筆地表示:馬斯克對此并不悔恨,甚至很有信心。
啼笑皆非的是,馬斯克本人可能并沒有這樣想。
而将這一問題深入思考,如果人們以後要求 ChatGPT 處理其它問題時,也出現了這樣的情況怎麼辦?
比如,相親網站的智能客服回答客戶時,AI 突然來一句離婚率連年上漲的話怎麼辦?或是在合同撰寫中,AI 标注了錯誤的金額怎麼辦?
被 " 玩壞 " 的 ChatGPT 未來在何處?
大火之後,流量明星 ChatGPT 現在終于不得不陷入尴尬的境地:問的人太多,它回答不過來了。
其團隊苦心孤詣簡化邏輯,提高計算速度仍難以滿足人類的好奇心,此刻的 ChatGPT 如同被問煩了的人類,陷入了 " 自閉 " 之中。
抛開它被吹捧的外衣,ChatGPT 實際上依靠的仍是人工智能領域十分底層的技術,算法雖然有所改進,但其本身依舊受制于程序員圈定的邏輯和硬件支持之中。
而 ChatGpt 本身也可能隻是一個半成品,其在網上試用的最主要目的在于進行更多的測試訓練,以便産生更多的有效标注數據。
換句話說,你我現在都是 ChatGPT 的免費教練。
值得期待的是,種種迹象表明,OpenAI 很有可能在 2023 年推出 GPT-4 技術,将在 GPT-3 模型基礎上繼續優化。
在獲得了全球免費教練的 " 貼心指導 " 後,我們有理由相信 OpenAI 将會打造一個更具人性化,更智能的 ChatGPT 2.0,并在商業中落地。甚至,我們也可以期待有一天 ChatGPT 可以真正從事需要高可信度的工作,而不會無辜地去捏造事實。
但僅就 ChatGPT 而言,這頭 " 新貴豬 " 可能還需要在風口再等一等。