" 什麽叫生成式?比如說,給我畫一幅車水馬龍的圖片。這種東西,過去人們不覺得是人工智能應該做的事,現在可以做了。"5 月 18 日,百度 CEO 李彥宏在天津舉辦的第七屆世界智能大會上演講時,說了這麽一句話。
不了解這個梗的朋友,可能 Get 不到這句話裏的笑點,以及背後的更多意思。
在 3 月份,文心一言剛剛發布的時候,有網友發現讓文心一言畫一張 " 車水馬龍 " 的圖片,它真的會畫出來有車、有水,有馬、有龍的一張圖。
有網友戲稱,這是逐字逐句的新藝術流派,也有人以此質疑文心一言的技術實力,甚至說讀不懂中文成語的 AI,怕不會是套殼外國模型吧?
3 個月過去,這個 Bug 早已不複存在,而當時的熱議似乎也悄無聲息。在越來越多的生成式 AI 上線後,大家發現無論中外哪個模型,大多是有長處也有短闆,而率先發布的文心一言,反而越用越好,漸漸有了獨樹一幟的意思。
這時候,李彥宏重新笑提 " 車水馬龍 ",似乎也就有了更多含義。首先這不是一種自證和洗白,因爲文心一言已經完成了自技術和應用上的自我證明,李彥宏在表達的,更多是一種雲淡風輕與坦然、誠懇。
這是百度面對 AI 的技術觀,也是中國 AI 面對未來的發展觀。
技術的誕生
往往迎着冷眼與嘲笑
事實上,任何一門能夠引起關注的技術,在誕生時往往伴随着的都不是歡迎,而是挑刺與嘲諷。這或許是人性使然,因爲破壞比肯定更容易,也更能引發關注,又或許是創新必然會突破某些人、某些事的舒适圈,從而也必然會得到負面評價。
早一點的例子,是工業革命的著名笑話:汽車在發明時曾經用來跟馬車比賽,結果輸了,當時無數馬車夫都在嘲笑這種笨重的鐵疙瘩,結果後來,就沒有後來了。
上世紀中葉,在晶體管剛剛誕生時,全球各界普遍不看好這種脆弱、良品率低的半導體材質,反而認爲優雅堅固的電子管才是王道,随後晶體管帶來了信息革命與計算時代,電子管被塵封在了曆史深處供人憑吊。
說個更近的例子,去年 ChatGPT 剛剛誕生時,就有人嘲笑它會把李煜、納蘭性德都說成明朝人,連林黛玉是《紅樓夢》人物都不知道,純純一個小傻子。與此同時,比起嘲笑更愛發現的用戶,已經找到了使用生成式 AI 的一萬種方法。
事實上,挑錯永遠容易。挂一漏萬,任何技術總有短闆,其實對于一個人也是一樣。HR 面試,需要問這個人才會什麽,而不是他不會什麽,否則拿着百科全書去找,一個人總有知識盲區。" 車水馬龍 " 這樣的問題,在文心一言這種涉及龐大數據與知識的模型剛剛發布時,近乎是必然存在的。今天乃至此後很久,文心一言也和其他大模型一樣,在很多垂直功能上有不确定性、不合理性。
隻有快速發現問題,快速修複問題,才是正确的解題思路,并且這也恰好是大語言模型基于用戶反饋快速叠代的價值所在。事實證明,文心一言确實做到了這點。
那麽換個角度想想,文心一言是不是能等一切都調教完美再發布呢?首先完美這件事本身就是相對概念,不可能存在絕對的完美。百度自己發現問題,效率遠不及跟全球用戶一起找問題。
其次,延遲發布雖然更穩妥,但會平白浪費了産業機遇,浪費了各界可以了解、參與到生成式 AI 的機會窗口。中國 AI 需要争分奪秒,而文心一言頂着壓力和被質疑、被嘲笑的可能,搶在 3 月 16 日就完成了發布,這件事本身就有點 " 孤勇者 " 的味道。
所以說,新技術誕生近乎是必然迎接質疑、嘲笑的。重要的不是你能說什麽證明自己,而是你接下來能夠做什麽來證明技術。
無法打敗你的,總是讓你更強大
李彥宏現在可以雲淡風輕提到 " 車水馬龍 ",就是因爲文心一言已經證明了技術實力,并且驗證了高效發布、快速叠代這個策略的正确性。
所謂的 " 車水馬龍 ",甚至更多問題,并沒有成爲百度大模型發展道路上的阻礙,反而成爲了百度能夠快速聽到反饋,完成叠代的佐證。
最終結果,已經可以在過去幾個月的發展數據中得到證明。
從經營業績上看,5 月 16 日,百度發布了截至 2023 年第一季度未經審計的财務報告,營收和利潤雙雙超市場預期,其中營收 311 億元,同比增長 10%,淨利潤(non-GAAP)57 億元,同比大幅增長 48%。分析師認爲,百度 Q1 的良好勢頭,與文心一言獲得的積極用戶反饋與市場回應緊密相關。百度在大語言模型層面的先聲奪人,已經取得了市場的廣泛認同。
而從技術數據上看,文心一言不僅在衆多核心技術上保持了領先,也爲業界帶來了最高效的升級、發展方法。通過文心一言與百度自研的産業級深度學習框架飛槳進行聯合優化,實現了文心一言發布後平均某周進行 1 此叠代的效率,經過 4 次叠代,實現了一言的推理能力提升近 10 倍。這意味着,文心一言的模型推理成本大幅降低,可爲 10 倍數量的用戶提供服務。
不難看出," 車水馬龍 " 這類問題,沒有成爲百度的短闆,沒有阻礙 AI 發展的腳步。相反,這些 " 梗 " 的存在,讓文心一言更加強大,讓中國 AI 更加強大。
心底無私天地寬
在中國科技圈裏,确實總是有一些企業,對自身技術存在過的問題大爲忌諱,總是扭扭捏捏,好像被抓到了什麽把柄。而這種态度,自然會激發網友的更熱烈讨論,最終形成 " 你不讓說,那我偏要說 " 的惡性循環。
相反,真的像李彥宏這樣,主動說破這層小尴尬,用幽默和坦然的方式面對這一切,卻會将格局打開,視野放寬。當然,這裏需要的自然是企業家的襟懷氣度,更重要的則是有技術底氣,知道一些問題根本不構成問題。
百度的技術底氣,就是百度并不僅僅有幾個模型、幾個算法。大模型要走向千行百業,萬家燈火,光有模型是不夠的。模型從哪來?模型用什麽來支持?還需要算力、框架、生态等多重動力,提供足夠的技術動能,來支撐大模型與行業适配,不斷完成升級。
這種積累,正是百度在 AI 領域的真正王牌。就像前面提到模型層的文心一言和框架層的飛槳進行聯合優化,起到了獨特的效果。百度在模型、框架、開發套件、工具等全棧架構上,都有自己的積累,都有領先的核心技術,最終彼此适配,高效協同,才能夠一次次帶來百度在 AI 領域的 " 驚喜 "。
這些 " 驚喜 " 包括首發文心一言,包括高效修複 Bug,包括 1 月 4 次叠代,也包括李彥宏的雲淡風輕。
相反,其他沒有自研深度學習框架、沒有底層技術積累,卻依靠風口進入 AI 領域的廠商,要麽需要花費巨大資源和經曆從頭研發,要麽基于 TensorFlow 和 PyTorch 等深度學習框架進行再開發,往往容易顧此失彼,最終讓自己的底氣也有所缺失。
在中國科技的創新路上,似乎始終都在說套殼,永遠都要說套殼。其實 " 套殼與否 " 這東西怎麽證明呢?隻有具備充沛的基礎設施與核心技術,漸漸會形成越來越明顯的差異化,最終用戶會證明一切,最終時間會證明一切。
談笑于過去,坦然于未來,勇猛于此刻,才能心底無私天地寬。百度如此,中國 AI 亦如是。