在 ChatGPT 剛發布沒幾天的時候,我們就迫不及待地想考考它:
它給出的答案讓我們沉默了一會,因爲它基本上總結了我們這一期視頻的内容。而且字通句順,言簡意赅。甚至當你追問的時候,它還能給你列出個 1 2 3 條來。而且這個 1 2 3 也跟我們寫的差不多 ......
随着進一步的探索,我們發現它還能幫你改 bug,做翻譯,算數學題,寫心靈雞湯和垃圾小說 ...... 這是我們第一次見到如此能說會道的 AI 模型,像所有用戶一樣,我們感受到了一些小小的震撼。
但再往下玩,我們又發現它好像 ...... 會不懂裝懂。比如當我們問它《資治通鑒》的第一句話是什麽意思時,它給出了這樣一個回答:
不懂古文的人,也許會被看起來如此有道理的解釋蒙騙過去。但實際上,這是 ChatGPT 在一本正經地胡說八道,跟正确答案毫無關系。
所以,ChatGPT 是怎麽變成 " 懂王 " 的?它會取代搜索引擎,甚至取代你嗎?
視頻版
↓↓ 看完這個視頻就知道了 ↓↓
↑↑ 信我,真的超級好看 ↑↑
圖文版
如果直接問 ChatGPT ,它會自稱是一個 " 語言模型 "。沒錯,更準确地說,ChatGPT 是一種 "大語言模型(Large Language Models)",簡稱 LLM。
什麽是 " 大語言模型 " 呢? 再問問它。
大語言模型能通過使用大量的文本數據來學習語言和文化背景。它們可以被用于生成文本,回答問題,翻譯,情感分析等各種任務。還有這個回答裏沒有提到的一點是,大語言模型的參數更多。
所以 ChatGPT,并不是電影裏那種什麽都會的,高級的 " 通用人工智能 "。其實直到目前,不管是下圍棋的AlphaGo,還是畫畫的 DALL · E 2,都隻是專精于某個具體領域的 AI 模型。ChatGPT 也不例外,隻是它專精的領域恰好是 " 語言 ",所以格外能說會道,就像是一個無所不知的 " 懂王 " 在跟你聊天。但實際上,它并沒有任何 " 智力 "。
由于它是一個擅長語言表達的 AI 模型,所以無論你問什麽,它都能給出一個流暢的回答——請注意,這個答案不一定是對的,但語言基本是流暢的,它的文本組織能力确實比很多真人都強。
不過 " 語言模型 " 并不是什麽新鮮玩意兒。爲什麽 ChatGPT 現在突然變得這麽強,這麽能說會道了呢?
我們會盡量用最簡單的語言來解釋這個問題,可能會有一點點硬,但它能讓你更好地理解 ChatGPT 的本質,以及它到底會不會取代你。
語言模型的核心,就是要根據上下文背景,預測接下來一連串文字出現的可能性。比如當前文出現這句話的時候,一個訓練有素的語言模型,就應該知道後面大概率要補上「狗刨」。
那怎麽才能讓語言模型學會預測呢?答案是,讓它們做 " 文字接龍 ",不要命地做文字接龍。
ChatGPT 是 GPT3 這個模型家族中的一員,這些模型的底層,是 Transformer 架構。
在 Transformer 架構之前,大部分語言模型主要基于 RNN 的架構,但問題是在于一旦文字過長,它就很難再記住前面的信息。另外,RNN 需要按照順序處理數據,所以處理大型數據集的時候效率相對比較低。
而 Transformer 采用了「自注意力機制」,也就是讓模型自己學習應該把重點放在句子裏的哪個詞上。并且這個機制主要靠一系列的矩陣運算實現, 而矩陣運算很容易在 GPU 中并行計算,所以能讓模型更高效地利用海量數據。這也是 GPT 模型比此前的語言模型更強大的地方之一。
在搭好架構之後,GPT 就可以開始用 " 文字接龍 " 的方式來訓練模型了:也就是在已知上下文的基礎上,讓模型預測下一個詞可能是什麽。
2020 年推出的 GPT-3 ,它訓練的單詞數量已經到了上千億的量級,參數也達到了驚人的 1750 億。你可能不理解這些概念,一個粗淺的解釋就是:它已經做刷了無數道文字接龍,所以不管你說什麽,它都能接着你的話頭無窮無盡地說下去 ......
不過還有一個問題:就是真實世界的文字接龍,是沒有标準答案的。
比如這道題,你可以填上 " 卡塔爾 ",也可以填上 " 亞洲 ",甚至 " 在哪兒?"。那怎麽讓 GPT 模型知道,人類想要哪個答案呢?
ChatGPT 在官方文檔中說,分三步:
第一步是給它提供人類想要的答案作爲示範。也就是讓标注者(labeler)自己根據數據庫中的問題,寫下标準答案,然後把問題和标準答案作爲數據,交給模型來訓練。這個階段的 GPT 模型,就像一個聰明,但不會寫答案的學生,需要老師來點撥一下。
第二步,讓微調好的模型根據問題産生一些答案。之前說過,模型輸出的是一系列文字的概率分布,所以每次産生的答案都不太一樣。人工标注者會給這些答案按照質量排序,信息量大的答案會排在前面。
有了這些數據,我們就可以訓練出一個 "回報模型",讓它根據問題給答案打分。有了 " 回報模型 ",就能進入到第三階段:也就是不斷重複 " 提問 - 生成答案 - 打分 " 的過程,并不斷優化模型的參數,讓生成的答案越來越接近我們想要的回答。
剛才這些,就是 ChatGPT 之所以能這麽強的技術原因——因爲它已經被訓練成了一個無情的文字接龍刷題機器。
不過,AI 領域的競争和創新都非常激烈,沒有任何模型能一直占據統治地位。AI 大牛 Yann LeCun 的說法是,沒有人能在這個領域比其他人領先 2-6 個月。Google 已經宣布即将推出的同類産品 Bard,得益于 Google 強大的技術和數據積累,誰更強還真不好說。
當然,你可能不關心哪家的技術更強。隻是想知道 ChatGPT,或者跟它類似的 AI 模型,會颠覆傳統搜索引擎,甚至取代人嗎?
這個問題,還是跟 ChatGPT 的本質,以及它的訓練方式有關。
就像剛才說過的那樣,ChatGPT 是一個 " 大語言模型 ",它巧妙地消化了海量以英文爲主的語料,再憑借娴熟的語言能力,回答你的問題。
在這個過程中,如果訓練語料不足或者不準确,就會出現問題。比如目前 ChatGPT 的訓練數據隻截止到 2021 年底,所以在這之後的知識,它就不知道了。
如果材料本身的豐富度有限,那效果也一般。此時不管你怎麽問,ChatGPT 都隻能翻來覆去,用不同的話術表達同一個信息,來回說片兒湯話。或者給出嚴重過時的信息。
更麻煩的是,有時它會給出貌似靠譜,但實際很離譜的回答。尤其是涉及非英文語言的時候,尤爲嚴重。如果用戶對這些問題不太清楚,那真可能被它的胡說八道蒙騙過去。跟很多大 V 一樣,ChatGPT 不光應該學會說話,還應該學會閉嘴,和事實核查。
但實話實說,AI 能做到這個程度已經非常強大了,而且足以完成一些人類工作。你也知道," 一本正經地胡說八道 "," 翻來覆去說片湯兒話 ",就是一些職業的日常工作 ......
而在語料足夠的時候,ChatGPT 對自然語言的理解和運用,比傳統搜索引擎更加出色。所以即便你是個小白,也可以用自然語言請教它,讓它幫你寫程序,寫歌詞,寫郵件,寫廣告文案 ...... 這些功能,是傳統搜索引擎無法提供的。
就像 OpenAI 的 CEO 所說的那樣,ChatGPT 不會取代搜索引擎,他們想做的是另一種更加好玩的産品形态。
至于會不會取代人 ...... 我們自己的感受是,AI 的普及,确實會消滅很多低端工種。比如一個人的工作如果隻是寫最套話的嘻哈,或者最水的雞湯,那除非他的工資比 AI 的訂閱費還低,否則早晚難逃一劫 ~
回過頭我們自己,如果是在做一分鍾科普小視頻的話,那已經可以失業了。畢竟 ChatGPT 這種 " 閱讀大量資料,再用普通人能聽懂的語言重新組織信息,回答問題 " 的流程,就是我們的日常工作 ......
不過,我們倒不太操心這一茬,也不關心 " 這個 AI 到底是聰明還是笨 " 的争論。因爲要緊的是,要趕快學會使用這些 AI 工具,讓它幫忙提高我們的工作質量——沒錯,使用 AI 也有門檻。很多愚蠢的答案,根源上是因爲提出了不好的問題。
有人淺淺嘗試,就覺得它是個傻瓜。但也有人從 0 開始,讓 AI 幫它寫出了一個能運行的程序。
這時候,就是考驗我們會不會善用 AI 作爲自己的工具了。也許,結局會像這句話說的一樣:"AI 不會讓你失業。會用 AI 的人,會讓你失業。"