萬衆期待下,百度終于在前幾天交出了 " 文心一言 " 的第一份答卷。
作爲國内乃至全球互聯網大廠中第一個勇敢 " 站 " 出來對标 ChatGPT 的存在,百度發布會關注度直接拉滿,也迎來了不少質疑。
圖源:網絡
從發布會召開之前,就開始流傳确認僞造的、說是需要百度員工頂替 " 文心一言 " 回答提問的聊天記錄截圖;再到發布會結束之後媒體直接将 " 市值上損失 XXX 億元 ",當作了百度本次發布的成績總結;甚至是上手實測之後,實際使用口碑有所反彈,許多人又開始吐槽 " 百度太急了 "。
全方位地吐槽與讨論,着實讓百度久違地、狠狠地火了一把。
雖說百度的确選擇了錄制而非現場演示,但關鍵還是在于 ChatGPT 讓人們自己提前形成的 " 高期望 ":所有人從心底不希望中國錯過這次重要創新變革機會,因此将 " 文心一言 " 設定在了能夠與 GPT3 甚至 GPT4 相匹敵的高期望上,自然無法避免将幾者進行比較。
而百度選擇盡早發布文心一言,恰恰也是考慮到時機——爲了抓住大模型這次關鍵 AI 變革,百度已經沒有時間磨蹭,必須往前趕。反倒是那些吐槽百度 " 太着急 " 的人,才是真的不理解這次變革的重要性,更沒有看清緊迫的形勢。
大模型,一個即将進入的 AI 新時代
圖源:百度智能雲
提到 AI 的落地應用,許多人并不陌生。
包括百度在内的中國科技公司們,通過自己研發 AI 技術棧,并且打造開放的能力平台,已經助力相當多的企業實現了包括語言理解、文本審核、文字識别、圖像審核、圖像識别在内的 AI 基礎能力落地。
與過去這些單一功能、細分行業場景的 AI 能力對比,ChatGPT 和 " 文心一言 " 帶來的不僅僅是自然語言處理(NLP)技術的躍升,更是算力時代 " 大模型 " 變革到來的昭示。
在上一波,由 CNN 卷積神經網絡模型爲核心的計算機視覺技術,開啓的 AI 應用落地浪潮中,很多想積極嘗試 AI 的企業都遇到了同一個難題:想利用 AI,但是獨立收集和标注數據的成本實在太大;大部分的 AI 數據集和神經模型也無法直接跨領域使用。
最終整個 AI 市場走入了 " 孤島式 " 的發展節奏,在幾個容易應用 AI 的行業(如安防、翻譯、語音識别、自動駕駛)被覆蓋之後,AI 的商業應用就陷入了 " 停滞 "。這種 " 停滞 " 背後,體現的是上一代 AI" 智慧能力 " 的有限,隻能解決相對簡單的特定問題。
ChatGPT 的各種表現震驚全場,就是 " 大模型 " 路線再次實現了人工智能 " 智慧能力 " 突破的最好證明。
舉個簡單的例子:過去爲了讓人工智能學會自動駕駛,我們就給它專門提供駕駛相關的圖片數據,希望直接 " 訓練 " 它學會開車。訓練出來的結果在特殊案例(不規範的道路标識、不遵守交通規則的其他車輛)上頻頻出錯,反倒阻礙了自動駕駛的進一步推廣應用。
而現在,我們可以先用更多的算力資源和時間,把各種圖片、視頻甚至文字的信息都丢給它,讓它不斷自我學習,最終形成一個基礎大模型(Foundation Model),随後再套用到自動駕駛這樣的具體應用領域,進行應用相關的優化和調整。相當于在它學會開車之前,先讓它學會辨認世界,實現 " 智慧能力 " 水平的突破。
以官方公布的 " 文心一言 " 投入爲例,訓練數據就包括了萬億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,及 5500 億事實的知識圖譜。這些龐雜知識的共同訓練,最終爲 " 文心一言 " 貢獻了思維鏈和複雜推理能力,讓解答各種各樣的疑難問題成爲現實。
在 " 智慧能力 " 提升之外,多種數據訓練而成的 " 大模型 " 在應用落地和商業化上也有着自己的先天優勢。
不同于過去人工智能的 " 孤島式 " 落地發展,每一個大模型都擁有可以對應廣闊的應用場景,在新應用場景落地的同時,還會給大模型本身帶來更多的原始數據,反過來不斷擴展大模型的智慧能力邊界。
最終形成 " 不斷應用、不斷吸納數據、不斷訓練、不斷增加能力、繼續擴大應用 " 的大模型能力 " 滾雪球 " 發展路線。
哪怕 " 大模型 " 對于算力和資金的需求遠比過去多,起碼可以确認沿着這條路線,更有希望讓人工智能逐步接近更高級别的認知智能水平,甚至是幫助人類決策和探索。
再不着急,就真的晚了
今年 2 月,外媒爆出微軟對 OpenAI 100 億美元投資并沒有換來任何股份,隻是階段性的分紅權利(總利潤達到 1500 億美元時,微軟的分紅權利自動停止)的新聞時,誇張的合作協議一度讓許多人不解。
真正的原因在于——跟過去很多可以 " 滾雪球 " 的賽道一樣," 大模型 " 賽道中的先行者将擁有接近壟斷的優勢。
根據業界測算,大模型的訓練往往起步就需要上千張頂級 GPU 加速卡,總價值有望超過 5000 萬,單次跑下來的電費、人力和硬件折舊就要接近 500 萬元。很多過去在人工智能行業中摸爬滾打的中小公司很可能都訓練不出來有競争力的 " 大模型 ",門檻的提升将會極大地拉開龍頭公司與追趕者之間的差距。
所以從今年 1 月正式宣布對 OpenAI 投資起,微軟短短幾個月就召開了一系列的發布會,并且實現了 ChatGPT 各種能力在微軟一系列重磅産品和解決方案中的落地,能看出它其實也很 " 着急 "、很 " 激進 "。
這個時候我們再來看百度的 " 着急 ",實在是再正常不過。能夠快速沖刺并且在全球科技大公司中首個輸出成績,證明了百度自身在大模型、AI 研究的深厚積累和投入。
百度在 NLP 大模型關鍵資源如 " 知識圖譜 "、" 語義計算 "、" 閱讀理解 " 等上有着多年的積累。其中知識圖譜的發展更是能夠追溯到 2014 年,通過逐步拓展多源異構知識圖譜的研發與應用,百度在 2019 年發布了 " 文心大模型(ERNIE)1.0",由其發展而來的 ERNIE 3.0,屢屢在全球性的人工智能語義理解競賽中獲勝,如今也成爲了 " 文心一言 " 的關鍵骨架。
在 " 文心大模型 " 之外,百度還擁有國内規模最大的深度學習框架 " 百度飛槳 ",截至 2022 年底,凝聚了 535 萬開發者、創建 67 萬個 AI 模型,服務 20 萬家企事業單位,位列中國深度學習平台市場綜合份額第一。作爲國内最大的搜索引擎服務商,百度更是擁有得天獨厚的數據資源優勢。
在關鍵的研發投入上,百度也在逐年加碼,2022 年核心研發費用 214.16 億元,占其核心收入比例達到 22.%,比例處于整個科技行業的最頭部。
盡管百度的積累和投入已經相當可觀," 大模型 " 成長所需的外部 " 助力 ",成爲了催促百度這麽短時間内交出成績的 " 最後一根稻草 "。
與過去互聯網時代的打造功能、打造應用思路不同,大模型有兩個關鍵的需求 " 強化學習 "、"prompt",前者是指将大量用戶的真實應用資料,再次融入到大模型的訓練資料中去,簡單點說,就是它必須要 " 先用起來,才能越變越聰明 "。
"prompt" 指的則是要從一開始就去圈定大模型有可能回答的答案範圍,從而讓它在運行過程中更好地理解用戶的問題,相當于提前打打 " 小抄 ",背背一些基礎知識點,是大模型覆蓋全新應用場景、行業必做的功課。
通過讓文心一言快速上線,并且逐步開展内測,百度将能夠擁有更多的用戶反饋,并且作爲資料融入到訓練當中,優化提升已有應用中的實際表現。通過快速建立生态,則可以幫助文心一言在已有能力範圍獲得快速落地,獲得實際用戶外,還能夠有規劃地拓展應用場景和行業,及早确定整個大模型下一步的訓練方向,實現 AI 工程與商業化的協調發展。
換言之," 文心一言 " 的發布會既是一次 " 交卷 ",也是百度全力踩下的一腳 " 油門 ",更是接下來加速發展的起點。再以過去互聯網時代的産品思路來審視,真的過時了。
圖源:百度創新時刻來臨,拼了就應該鼓勵
相比産品上的表現,盡管 OpenAI 很強、微軟全力投入在前,百度仍高調預熱并發布,積極殺入大模型市場的拼勁,才是最值得普羅大衆所關注的。
跟過去的自研芯片、自研大飛機等重大科技挑戰一樣,AI" 大模型 " 之戰,即将逐漸成爲中國不能輸的一場戰争。打破技術封鎖,實現獨立自主發展的唯一辦法,就是全力創新,而且是九死一生的創新。
尤其是目前 "OpenAI+ 微軟 " 的強力組合,已經威脅到了國内企業 " 大模型 " 賽道後續的發展。百度能在這個時候第一個站出來直面壓力輸出成果,就應該鼓勵、提供助力,而不是嘲笑。
隻有普通用戶更包容現有的技術差距、積極使用并且給出反饋;産業積極使用,快速拓展整個生态的活力和商業潛力;政策制定者量身定制更鼓勵的營商環境等多方齊心協力,像百度這樣的、肩負創新重任的民營企業,才有可能赢下最終的比賽。