圖片來源 @視覺中國
文 | 數智界,作者 | 祝彰,編輯 | 嘉辛
1950 年,英國科學家圖靈在一篇論文中預言,人類有可能創造出具有真正智能的機器。
著名的「圖靈測試」就此誕生:如果一台機器能夠與人類展開對話,而不被辨别出其機器身份,那麼稱這台機器具有智能。
也是從那時開始,人類世界開始了對人工智能長達半個多世紀的探索,但至少在 2000 年以前,困難總比驚喜多,人工智能還經曆了兩次發展寒冬:
一次是在 1974-1980 年,受限于計算器計算能力,AI 技術研究遇冷,研究資助被大規模縮減甚至取消;另一次是在 1987-1993 年,期間人工智能計算機 DARPA 的失敗為 AI 潑了一盆冷水。
失敗也不全是壞事。跌跌撞撞盛衰起伏的過程中,AI 的發展在 2006 年以後邁進了新的階段——由機器學習邁入了深度學習階段,離真正的人工智能更近。
自此之後,人類對 AI 的探索之旅明顯加快,一些重要的裡程碑時刻相繼出現了。比如 2014 年,第一台通過圖靈測試的計算機誕生,它讓人類相信它是一個 13 歲的男孩;比如 2016 年,ALphaGo 戰勝圍棋世界冠軍李世石。
再到 2022 年底,ChatGPT 一夜爆火。
不過,縱觀 AI 的曲折進程,技術與實驗成功之間隔着一道牆,實驗成功與大規模應用之間又隔着一道牆,應用落地與最終的商業化之間,也隔着一道牆。
這導緻,我們依然無法對 AI 的進程抱有太高的期待,包括當下火熱的 ChatGPT。
ChatGPT 為什麼能爆火?
2022 年下半年,科技界最受矚目的大事件,莫過于美國的人工智能研究公司 OpenAI 發布了 ChatGPT。
ChatGPT 是一個智能對話系統,用戶在注冊後,能夠對這個系統發出各種各樣的提問,系統自動生成答案。
最開始,沒有人會想到,這樣一個隻是提供人機交談的系統,卻成了 2022 年全球最後一個爆款産品。
OpenAI 11 月 30 日發布了它,短短一周後,全球範圍内已經至少有 100 萬人在使用它。
OpenAI 的公司估值也水漲船高。根據媒體 1 月 10 日的相關報道,微軟計劃向 OpenAI 投資 100 億美元(合人民币 677.51 億元)以收購其 49% 的股權,目前雙方正在談判,預計 OpenAI 投後估值将達到 290 億美元。
再到 1 月 12 日淩晨,OpenAI 在社交平台上表示,其開始考慮對 ChatGPT 進行收費,以實現商業化,可能包括 ChatGPT Professional(專業版)、每月訂閱付費等方式。
短短半個月的時間,ChatGPT 實現了一定程度的規模化、赢得了高估值、還将商業化提上日程,它的成長速度足以令人咂舌。
ChatGPT 能短時間内爆火的原因,數智界認為有兩點:
第一,從表層來看,ChatGPT 表現得更聰明了。
ChatGPT 不隻能回答簡單的知識性問題,還能夠回答開放式問題,并且能與用戶進行多輪對話。比如用戶此前在社交媒體上分享的問題中,就包括了讓 ChatGPT 寫代碼、與 ChatGPT 聊人生哲學、讓 ChatGPT 寫詩等等。
在很多問題場景下,ChatGPT 都給出了出乎意料的回答。比如下面這段,ChatGPT 用魯迅的文筆描述網友的心情:
" 在疫情的蔓延中,我困了門裡,困了心裡。屋外一片荒涼,想起一頓火鍋的香味,瞬間讓我心慌。這時候我才知道,疫情來臨,它讓人生無聊而悲涼,也讓我們看到自己的無助與弱點。然而我們又豈能放棄對美好的追求,豈能把欲望壓抑到不想吃火鍋的地步?"
第二,ChatGPT 的走紅背後,AI 大模型正在成為行業趨勢。
人工智能中,NLP(自然語言理解)是一個核心概念,被稱作是人工智能皇冠上的明珠。
在 NLP 中,之前往往需要對單個小任務進行訓。比如要讓 AI 掌握對話的能力,需要一個小模型、要讓 AI 學會協作,需要另一個小模型、要讓 AI 能閱讀能理解,又需要另一個小模型。
但是人工智能從機器學習階段邁入到深度學習階段之後,現在單個大模型就可以完成各種類型的任務訓練,也就是對不同問題在同一個模型上進行預訓練。
深度學習裡有個 Double Descent 現象:随着模型參數變多,測試錯誤率會先下降、再上升,然後第二次下降。原則上,在成本可接受的情況下,模型越大,準确率越好。
具體到 ChatGPT 的發展來看:
2018 年第一代 GPT 面世時,OpenAI 還隻是用它來做語言理解方面的任務;
2019 年 GPT-2,得益于更高的數據質量和更大數據規模,其生成的故事在流暢度和邏輯性上更加完善;
2020 年的 GPT-3,更加完善成了一個大型語言預測和生成模型,能夠生成長序列的原始文本,語言處理更強大、更快,甚至無需任何特殊的調優;
再到當前的 GPT-3.5,則是一個多模态大模型,比起之前的版本更加成熟、準确率越高。
ChatGPT 的商業化前景如何?
僅當前來看,ChatGPT 的表現已經帶給了人類驚喜,但必須要知道,它現在依然面臨着一些缺陷。
比如在回答某些問題時,它可能給出看似合理、實則是錯誤乃至荒謬的回答;比如你反複問同一個問題,但是用不同的話術,很可能會得到前後不一的答案;比如它的很多回複過于冗長;比如它現在還無法完全拒絕一些不合理、不道德的請求;
但這些問題的存在并不會完全阻斷 ChatGPT 的商業化路徑,OpenAI 考慮通過專業版和每月訂閱付費開始商業化,就說明了這一點。
國海證券在一份研報中指出,随着 ChatGPT 的不斷調優,其有望在醫療、客服機器人、虛拟人、翻譯、營銷、遊戲、社交、教育、家庭陪護等多個領域被應用,潛在的商業模式存在以下幾種:
雲服務——客戶使用 ChatGPT 的雲服務來支持他們的聊天機器人應用程序;
内容營銷—— ChatGPT 根據用戶的興趣和喜好向用戶推送廣告;
數據盈利—— ChatGPT 生成的大量數據,包括會話日志和客戶反饋,這些數據可以通過出售給第三方或用于改進 ChatGPT 的功能來變現;
咨詢服務—— ChatGPT 可以分析客戶對話并提供見解和建議,以改善客戶體驗;
版權授權—— ChatGPT 可以授權給希望在自己的聊天機器人應用程序中使用其功能的客戶。
當然,以上這些潛在的商業模式,實際上是整個對話式 AI 都面臨的巨大空間。ChatGPT 隻是作為其中最具代表性的 AIGC 文字内容生産工具之一,優勢更明顯。
我們也看到,基于 ChatGPT 的商業潛力,很多科技巨頭都在加快布局。反應最快也最激烈的,是微軟。
早在 2019 年,微軟就向 OpenAI 投資了 10 億美元,前段時間 ChatGPT 爆火後,微軟又傳出欲以 100 億美元收購 OpenAI 的消息——如若交易達成,這将成為微軟迄今為止最大的一筆投資。
最新的消息是,微軟 CEO 納德拉表示,微軟計劃将 ChatGPT 等 OpenAI 的人工智能工具整合進公司所有産品,并将其作為平台供其他企業使用。
一個有趣的細節是,此前微軟盡管多年來連續投資 OpenAI,但比爾 · 蓋茨并不喜歡這項投資,他對 OpenAI 的技術持懷疑态度,認為其部分側重于計算機掌握人類語言含義的能力。
但是在 1 月 12 日的一次活動中,當被問及如何看待 ChatGPT 時,他表示," 這讓我能一窺未來,整個平台的方法和創新速度都令我印象深刻。" 态度已然轉變。
ChatGPT 會取代搜索引擎嗎?
ChatGPT 爆紅之後,其在編程、文本生成等 NLP 領域強大的能力已經引發了部分行業的擔憂。
比如由于 ChatGPT 擁有基于對話形式接收輸入指令并輸出結果的能力,與傳統的搜索引擎功能具有一定的重合。
我們也看到,最近搜索引擎巨頭谷歌動作頻頻,顯然感受到了 ChatGPT 帶來的壓力。
據媒體報道,谷歌 CEO Sundar Pichai 參與了一系列探讨谷歌 AI 戰略的會議,同時公司的研究、信任與安全等部門和團隊,将被組織重整,旨在幫助開發和發布新的 AI 原型和産品。
谷歌還要求員工開發能夠創建藝術品和其他圖像的 AI 産品,對标的正是 OpenAI 的另一項産品 DALL-E,一個可以根據書面文字生成圖像的人工智能系統,目前已經吸引到超過 300 萬用戶。
報道還指出,谷歌管理層已經發布了 " 紅色代碼 " 警報。在矽谷,這就意味着拉響了 " 火警 "。
谷歌擺出積極防禦姿态的同時,關于 ChatGPT 會不會取代搜索引擎的讨論,也一再升溫。
去年 12 月,摩根士丹利投行的首席分析師 Brian Nowak 在一份研報中提到,語言模型可能會占據市場份額,并破壞谷歌作為互聯網用戶入口的地位。
專欄作家 Parmy Olson 也撰文指出,相比谷歌搜索抓取十億個網頁内容編制索引,然後按照最相關的答案對其進行排名,包含鍊接列表來讓你點擊,ChatGPT 可以直接基于它自己的搜索和信息綜合的單一答案,回複流程更加簡便。
不過就目前階段而言,說 ChatGPT 可以直接取代搜索引擎,恐怕還為時尚早。
參考中國銀河證券的觀點,其認為有兩點原因不能忽略:
第一,ChatGPT 與傳統搜索引擎的功能和優勢并不相同。
搜索引擎是幫助人們做信息檢索的,人們的檢索行為會返回多條查詢結果、準确率也較高,并且搜索引擎不會對信息做出判斷,完全呈現結果供用戶進一步篩選;
ChatGPT 則是一個自然語言處理模型,用戶輸入單一指令,隻能得到單一結果,以此來确保與用戶對話過程的流暢性。
第二,二者的應用領域不同。
搜索引擎的信息庫抓取信息快、信息庫更新頻率高、存量大,主要用于幫助用戶快速查找匹配信息、找到感興趣的信息,嘗嘗應用在文獻檢索、互聯網搜索等領域;
而 ChatGPT 的語料庫來源于離線數據,輸出的文本存在虛假信息的可能,且吸納新的知識需要對模型進行再訓練和微調,這會導緻訓練成本和甄别成本上升,因此主要應用在人機對話、智能客服、智能問答等強邏輯性的自然語言交互領域。
除了這兩點原因之外,ChatGPT 還面臨着信息老舊的問題。它并不會在網絡上抓取實時信息,知識僅限于 2021 年之前學到的東西。
基于以上幾點,短期之内,ChatGPT 無法取代搜索引擎,但它可以作為當前搜索引擎服務的一種補充,也會對現有的搜索引擎公司産生一定的沖擊,促進巨頭間競争。