2022 年 11 月,OpenAI 發布聊天機器人 ChatGPT。
上線五天,ChatGPT 吸引了超過 100 萬的用戶,很快有了 ChatGPT 代替程序員、文字工作者以及搜索引擎的聲音。
ChatGPT 問世兩周内,Google 拉響「紅色警報」。随後,Google 兩位聯合創始人被 CEO 召回。
上線兩個月,ChatGPT 的用戶數量達到 1 億。
時間來到今天,在 ChatGPT 為全世界矚目之後,搜索引擎的行業巨擘 Google 和百度終于出手,推出了各自的「ChatGPT」。
Google CEO 親自出馬,迎戰 ChatGPT
北京時間 2 月 7 日淩晨,Google CEO 桑達爾 · 皮查伊(Sundar Pichai)宣布,推出一款名為 Bard 的實驗性對話 AI 服務。
Bard 先向部分開發者開放,未來幾周内将和更多公衆見面。
CEO 親自下場發布公開信,Bard 被列為「code red」優先級項目,行業老大終于和 ChatGPT 正面剛了。
2021 年 5 月,Google 推出了大語言模型 LaMDA。2022 年初的官方論文介紹,LaMDA 模型使用多達 137B 個參數訓練,展示了接近人類水平的對話質量。
Bard 就是基于 LaMDA 模型運行,但當前用的是更輕量的版本,需要的計算能力更少,所以能夠擴展到更多的用戶,從而獲得更多的反饋。
當 ChatGPT 受限于 2021 年以前的數據,Bard 将與世界保持同步:
Bard 緻力于将廣泛的世界知識與大型語言模型的強大功能和創造力結合起來,它利用來自網絡的信息為輸入問題提供最新、高質量的回答。
從官方公布的圖片來看,Bard 有着和 ChatGPT 類似的對話框。
Bard 可以簡化複雜的主題,比如向 9 歲的孩子解釋 NASA 韋伯望遠鏡的新發現,或者讓你了解當前足球界的最佳前鋒。
Bard 也可以幫助完成更加具體和主觀的任務,包括「計劃朋友的新生兒派對」「比較兩部奧斯卡提名的電影」「根據冰箱裡的食物獲取午餐創意」等。
不過,Google 并沒有提到将 Bard 整合到搜索之中,但确實計劃在搜索中加入新的 AI 功能。
Google 發現,當人們使用 Google 搜索時,不僅需要事實性答案,比如「一架鋼琴有多少個鍵」,也會越來越多地需要洞察,比如「鋼琴或吉他哪個更好學?分别需要練習多久才能掌握?」。
AI 的作用就在這裡。面對沒有标準答案的問題,它可以給出更加綜合的信息,将複雜的信息和多種觀點提煉成更好理解的回答。
未來「AI 加強版」的 Google 搜索,既會查找更加豐富的觀點,比如同時彈鋼琴和吉他的人的博客,也會讓你更加深入了解一個相關主題,比如初學者入門的步驟有哪些。
在這個維度,AI 改變了我們與信息的關系,就像 Google CEO 皮查伊所說的:
最令人興奮的機會之一是,AI 如何加深我們對信息的理解,并更高效地将其轉化為有用的知識,幫助人們在搜索時更容易地找到核心,并達成目的。
聊天機器人競賽,現在開賽
在發布 Bard 之前,Google 有過這樣那樣的猶豫,不知是借口還是出自真心。
CNBC 報道,Google 的 AI 負責人傑夫 · 迪恩(Jeff Dean)曾經告訴員工,Google 在提供錯誤信息方面存在更大的「聲譽風險」,所以「比小型初創公司更保守」。
這是可以理解的,畢竟聊天機器人通過互聯網的大量文本學習,因此它們無法區分事實和虛構,也可能延續互聯網和人類社會固有的偏見。
或許更為實際的原因是,大型語言模型會影響 Google 搜索當前的商業模式—— Alphabet 2021 年收入約有 81% 來自廣告,其中大部分是 Google 的按點擊付費廣告。
即将面世的 Bard,說明 Google 改變了立場。
盡管 Google CEO 皮查伊強調,必須以「大膽和負責任的方式」開發 AI,但沒有詳細說明如何避免有害内容,隻是說将外部反饋與内部測試相結合,确保 Bard 的回答在質量、安全性和接地性方面達到高标準,算是回應了「聲譽風險」的問題。
在 ChatGPT 穩坐王位 2 個多月後,聊天機器人之戰才真正地打響了。
下個月,Google 将開始對接獨立開發者、創作者及企業,讓他們嘗試基于 LaMDA 及一系列模型打造出的生成式語言 API。
已向 OpenAI 投資數十億美元的微軟,也緊趕慢趕地把 ChatGPT 整合進自家的搜索引擎和辦公軟件。集成了 ChatGPT 的新版 Bing,曾在 2 月 3 日短暫上線。
根據設計師 Owen Yin 分享的截圖,新版 Bing 的搜索框變為聊天框,Bing 會在聊天氣泡中回複用戶的問題。新版 Bing 鼓勵用戶使用自然語言而不是關鍵字進行搜索,還能夠根據用戶的要求調整搜索結果。
在 Google、微軟等互聯網巨頭之外,You.com、Perplexity AI、Neeva 等不少初創公司也加入了競争,推出了類似的聊天式搜索引擎。
其中 You.com 由語言和人工智能專家 Richard Socher 創立,可以通過聊天界面提供答案, 回複帶有引用,幫助用戶追蹤一條信息的來源,這是 ChatGPT 所沒有的功能。
但這個長處并非獨一無二,OpenAI 正在開發一個名為 WebGPT 的 AI 系統,WebGPT 将能夠更準确地回答問題,甚至還能說明引用的來源。
這是一個競賽的過程,也是一個互相補足的過程。
另外,百度版 ChatGPT 項目「文心一言」(英文名 ERNIE Bot)也已官宣,三月完成内測,即将向公衆開放。
官方表示,百度在 AI 領域深耕數十年,擁有産業級知識增強文心大模型 ERNIE,具備跨模态、跨語言的深度語義理解與生成能力,「ChatGPT 相關技術,百度都有」。
在第一财經的采訪中,多位 AI 界行業人士指出,ChatGPT 的出圈本質是算力與樣本量提升後得到的自然結果。
現在各個公司都交出了自己的答案,在搜索引擎的本業上做出颠覆,也意味着當大模型、大數據、大算力厚積薄發,訓練數據中的統計規律到達節點,我們就迎來了 AI 的「寒武紀大爆發」。
搜索引擎迎來真正的挑戰
Google 加急推出對抗 ChatGPT 的聊天機器人,某種程度上可以說明,搜索引擎真正意義上地遇到了挑戰。
從上世紀末以來,搜索引擎「索引、檢索和排序」的固有模式已經統治了 20 多年,Google 每年都會對搜索引擎進行數千次更改,其中大多數都很微小,并沒有發生根本性的變化。
搜索引擎的核心是海量信息集合,而非信息創造。你在搜索框輸入關鍵字,搜索引擎根據算法,抓取、索引、排序與你的查詢匹配的結果,然後你看到了大量鍊接,再從中尋找自己需要的信息。
而 ChatGPT 屬于 AIGC(人工智能生産内容),是一種新的内容創作方式。它已經被數據集訓練完畢,通過一對一的對話和類似人類的口吻,給出單一、即時的答案,還能結合上下文,實現多輪對話,幫你解決更為複雜的、連續性的問題。
有時候 ChatGPT 顯得很笨,它隻生成文本,缺乏時效性,也無法顯示信息來源,并不保證準确,甚至還會做錯小學的算術題,就算給出錯誤信息,仍然有自信的口吻。
但需要注意的是,它仍處于起步階段,就已經在根本上改變了我們與知識的相處形式。
正像上文所提到的,當人們使用 Google 搜索時,需要的不隻是事實性答案,而是越來越多地需要洞察。就算隻是将搜索引擎和聊天機器人互相補充使用,也說明我們對「搜索」的根本需要改變了。
讓 ChatGPT 變得更聰明,人類首先需要學會如何與它溝通,這已經是人類的一項必備技能。
遊戲博主 @祝佳音教會了 ChatGPT 用老北京口吻說話,UC Riverside 的研究人員讓 ChatGPT 熟讀美國哲學家 Daniel Dennett 的著作,然後讓它僞裝成哲學家本人回答問題。初級的「數字生命」,在 ChatGPT 身上得以實現。
再比如,你可以一步步引導規則,讓它設計遊戲等産品,或者給它一段程序,讓它檢查 bug,還可以給它演示案例,讓它舉一反三。互動越複雜,ChatGPT 的能力也會越豐富。
全世界還發生着許多主動要求 AI 代勞的場景,從學期論文、創意策劃,到房産介紹、法律文書。
我們可以批評 AI 當下的準确性,但我們也應該看到它的創造性。它并不真正理解世界,但它實際上能夠做到用自然語言交流,溝通對話者的需求,高效地處理海量信息,以後還能夠做得越來越好。