圖片來源 @視覺中國
文 | Alter
ChatGPT 走紅的速度,顯然超過了許多人的預期。
即使是在中文互聯網上,和 ChatGPT 有關的報道、讨論,早已超過了其他科技概念,甚至萌生出了 "ChatGPT 概念股 " 的說法,不少與 AI、大模型、NLP 相關的中概股,短期内的漲幅 " 意外 " 達到了 50% 以上。
每一次有 " 科技大事件 " 上演時,都有人蠢蠢欲動,有人借勢起風,ChatGPT 掀起的浪潮似乎也是如此。
可當我們在讨論 ChatGPT 的時候,到底在讨論什麼?颠覆式創新的技術洗禮,抑或是對人工智能前景的樂觀,還是在潛移默化中被有心人帶了風向。厘清這些問題的答案,遠比讨論 ChatGPT 本身更有價值。
01 一場自上而下的 " 出圈 "
和 2016 年的 AlphaGo 一樣,ChatGPT 的 " 火 " 也呈現出了自上而下的軌迹。
答案就隐藏在一篇篇 10W+ 的爆款文章中。和 ChatGPT 相關的文章可謂盈千累萬,除了大批科技和财經類自媒體的分析與報道,就連旅遊博主們都開始以 ChatGPT 為主題,而且内容特别貼地氣:
大多是博主與 ChatGPT 的對話截圖,其中問題本身就相當有話題性,截取的問答同樣吸引眼球,再稍微關聯下 AI 取代人的宏大話題,以及可能存在的應用場景,短時間即可炮制出一篇大衆喜聞樂見的文章。
追熱點向來是自媒體們的 " 天職 ",以爆紅的 ChatGPT 為題也無可厚非,問題恰恰出現在信息的不對稱上。
從 2022 年 11 月底上線運營,到 2023 年 1 月末的上億月活,ChatGPT 用兩個月的時間就刷新了用戶增長的曆史記錄。隻是在注冊體驗 ChatGPT 嘗鮮過程中,對中文互聯網的用戶相當不友好。
想要打開 OpenAI 的網址,前提是有 " 科學上網 " 的工具,而且 ChatGPT 并未對中國開放注冊,必須要用海外的手機用來接收驗證碼……可以說人為增加了重重壁壘。在這樣的注冊機制下,和 ChatGPT" 暢聊 " 的國内網民注定是 " 少數派 ",大多數網民對 ChatGPT 的理解,是從别人口中 " 聽 " 來的。
正是在這樣的語境下,ChatGPT 的 " 神奇能力 " 被不斷放大。個中原因離不開人們對對話式機器人的特殊情愫。
無論是誕生于 2014 年的微軟小冰,以 " 智能助手 " 自居的 Siri,還是主打語音交互的智能音箱,都曾吸引無數人的好奇心,在特定時間内引發了現象級的讨論。畢竟早在上個世紀初,圖靈就提出 " 對話 " 是測試機器是否有人類智慧的有效場景。
沿循類似的邏輯,ChatGPT 的 " 出圈 " 是注定的結果。背靠千億級大模型 GPT-3,ChatGPT 的自然語言理解能力遠超早期的微軟小冰和 Siri,和用戶對話時不會根據一兩個關鍵詞機械地輸出結果,而是理解用戶的 " 語義 ",輸出的準确性和關聯性不可同日而語,并在很大程度上刷新了人們的認知。
然而目前的 ChatGPT 還是大規模離線語料進行訓練的版本:無法将即時信息納入自己的回答中;經常給出一些看似合理但不正确的答案;對話中涵蓋的因果關系,仍缺乏很好的理解能力;缺少人類舉一反三的能力 ...... 并不能像朋友一樣自由對話。
陰謀論一些的話,在 ChatGPT 走紅的這些日子裡,并不缺少一些 " 炒作 " 的痕迹。比如讓人摸不着頭腦的 "ChatGPT 概念股 ",至今還沒看到哪家中概股與 OpenAI 開展合作,所謂的概念股,多半是在蹭文本生成、信息抽取、知識抽取、機器問答等技術的熱度,屬于典型的 " 借事說事 "。
而就當前的态勢來看,ChatGPT 的熱度還将持續一段時間,但被刻意營造的期待值,就像是鼓吹起來的氣泡,再美麗也有被刺破的一天。與其去讨論 ChatGPT 的短期效應,不如将視角放在對行業的長期影響上。
02 ChatGPT 的偶然與必然
或許 ChatGPT 的 " 蹿紅 " 有些偶然因素,可類似産品的出現卻是必然的結果。
可以佐證的是,在 ChatGPT 熱度空前的局面下,競品們正在加速追趕:谷歌 CEO 桑達爾 · 皮查伊在 2 月 7 日淩晨宣布将推出一款名為 Bard 的實驗性對話 AI 服務,并将在幾周内向部分開發者開放。
幾乎和谷歌同一時間,百度官宣将推出類似 ChatGPT 的人工智能聊天機器人,項目名字被命名為 " 文心一言 ",英文名 "ERNIE Bot",預計在 3 月份完成公測,或将直接接入百度搜索向公衆開放。
人工智能初創公司元語智能連忙推出了功能型對話産品 ChatYuan;阿裡達摩院牽頭的類 ChatGPT 對話機器人被曝正處于内測階段;昆侖萬維宣布将與奇點智源合作年内發布中國版類 ChatGPT 代碼開源……還有更多産品在官宣的路上,不排除會出現畫虎不成反類犬的尴尬場面。
一種流行的解釋是:ChatGPT 将取代搜索引擎。其中被引用最多的 Gmail 創建者之一 Paul Buchheit 的觀點:" 像 ChatGPT 這種 AI 聊天機器人将摧毀谷歌,就像當年搜索引擎徹底幹掉黃頁電話簿一樣,時間上就是這一兩年。" 内在的商業邏輯在于,一旦搜索引擎确定的信息檢索方式被颠覆,整個互聯網商業都将重新洗牌,沒有哪家互聯網巨頭想要錯過在新格局中占有一席之地的可能。
或許還有另外一種解釋,即 ChatGPT 的誕生是一種方向性的探索。OpenAI 率先驗證了對話 AI 的可行性,然後谷歌、百度等快速跟進。之所以能夠在短時間内推出類似 ChatGPT 的産品,原因還要從大模型說起。
時間撥回到 2017 年,當時還在谷歌任職的 Ashish Vaswani 等人提出了 Transformer 架構,讓深度學習的參數達到了上億的規模;2018 年谷歌推出了基于 Transformer 的雙向深層預訓練模型 Bert,參數首次超過了 3 億規模;OpenAI 同年提出了生成式預訓練 Transformer 模型 GPT,進一步推動了大模型的發展。
但直到 2020 年,大模型才真正進入到大衆視野,誘因正是著名的 GPT-3,擁有 1750 億個參數量,是傳統深度學習小模型的一萬倍以上,同時讓外界看到了 " 大力出奇迹 " 的一幕:常見小模型需要對不同的任務使用不同模型分别訓練解決,而 GPT-3 先使用海量數據預訓練大模型,然後将模型參數初始化後再進行訓練,實現了作詩、聊天、答題、翻譯、寫代碼等一系列能力。
一場千億級大模型的軍備競賽由此拉開帷幕。
僅在 2021 年,國内的華為、智源、浪潮、阿裡雲、百度等企業先後發布了自家的大模型産品,而後不斷從 NLP 延伸出了雙語、CV、跨模态等大模型。據 OpenBMB 開源社區的統計,目前全球超千億參數的大模型中,中國貢獻了 1/3,美國貢獻了 1/2,世界其他國家或組織貢獻了剩下的 1/6。和曆史上的許多次 " 軍備競賽 " 一樣,耗費了大量真金白銀的大模型,最終也需要找到一個商業化出口。
有趣的地方在于,不管是 GPT-3,還是 ChatGPT,OpenAI 兩次站在了新舊交替的臨界點上,第一次掀起了大模型熱,讓全球科技大廠們冒險一試,這一次能為大模型的商業化帶來生機嗎?
03 大模型商業化的 " 火炬 "
大模型的性能表現不可謂不性感,代價則是訓練大模型非常燒錢。
根據公開數據顯示,GPT-3 訓練的硬件和電力成本高達 1200 萬美元;谷歌在訓練包含 5400 億參數的 PaLM 時用了 6144 塊 TPU ……坊間由此出現了對盲目 " 煉大模型 " 的質疑,資本市場因為大模型的應用問題遲遲不肯下注," 多才多藝,身兼多職 " 的大模型們距離 " 生存危機 " 越來越近。
并非是大模型缺少商業化故事。按照大規模預訓練的思路,大模型 + 細分場景微調在某種程度上給出了人工智能在長尾場景落地的最優解,而且在小樣本訓練的情況下,大模型也有着比較好的提升。
大模型也不缺少落地的場景。AIGC 在 2022 年就已經走紅,投資機構紅杉在 2022 年發布的一篇分析文章中特意提到,生成式 AI 有潛力産生數萬億美元的經濟價值,進一步增強了相關創業者的信心。
可在 2023 年以前,很少看到資本市場對大模型的關注,僅有智譜 AI 等為數不多的企業拿到了融資,與之形成鮮明對比的是,AIGC 賽道裡初創企業早已是資本寵兒。資本甯願在應用層的 AIGC 賽道試錯,也不願燒錢給大模型。
誠如熊彼特在《經濟發展理論》中的觀點:資本是創新的杠杆。倘若隻是企業和研究院在花大價錢 " 煉 " 大模型,缺少資本産生的杠杆作用,大模型的價值和應用場景恐怕很難脫離 " 學術 " 二字。
ChatGPT 的出圈就像是一把火炬,不但徹底吸引了外界的注意力,也可能為大模型的商業化照亮方向。
直接的例子就是微軟 " 反常行為 "。先是 100 億美元投資 OpenAI,而後宣布将 ChatGPT 融入旗下全線産品,比爾・蓋茨和納德拉頻頻為 ChatGPT 站台,再到 ChatGPT 版的必應和 Edge 浏覽器,甚至裁撤工業元宇宙部門為 ChatGPT 讓路,俨然擺出了一副 All in AI 的新姿态。微軟的真實動機還不得而知,映射到外界眼中的卻是:微軟正在開啟 AI 的商用之戰,大模型迎來了商業化元年。
OpenAI 也在不斷釋放好消息:2 月 1 日宣布推出付費訂閱版 ChatGPT Plus,每個月向用戶收取 20 美元的費用;同時 OpenAI 預計 2023 年的收入将達到 2 億美元,2024 年收入有望超過 10 億美元。
其實早在 2020 年的時候,OpenAI 就已經開始為商業化謀局,GPT-3 不再完全開源代碼,但提供了商用 API,允許開發者調用大模型的部分能力,并逐步為 Dall · E2、Whisper 等大模型開放了 API 接口。客戶調用 OpenAI 的 API,以獲取圖像、語言、代碼生成等能力,進而趕上 AIGC 的順風車,OpenAI 從中收取接口費,初步形成了模型研發、應用開發到消費的完整産業鍊。
故事講到這裡,似乎讓人看到了大模型的可觀前景:當國内大大小小的互聯網企業争相推出各種版本的 ChatGPT 時,勢必會将注意力盯向提供底層能力的大模型,為國内的大模型市場注入一股活水。
再樂觀一些的話,即便 ChatGPT 的潮水會褪去,隻要在不斷地試錯中摸索出大模型的商業化路徑,資本的注意力終将會聚集到底層技術上,并将注意力轉變為源源不斷的投資,賦予大模型可持續的驅動力量。
04 寫在最後
現實的殘酷在于,新物種崛起的時候,會習慣性吹起一層層泡沫,特别是在過去幾年中,泡沫被戳破的時間周期越來越短。
2021 年初爆火的 Clubhouse,故事在一個多季度後就宣告 " 破産 ";2022 年初的元宇宙,下半年就被 AIGC 搶去了風頭;ChatGPT 引起的新風口,會是一個例外嗎?就情感上而言,我們希望 ChatGPT 帶來的是一場熊熊烈火,引燃人工智能的産業革命。
可惜當前的所有設想,都還建立在理想的假設上,現實中仍存在太多的不确定性,還需要跨越一座又一座山丘。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App