李彥宏說模型開源的意義其實不是很大。
4 月 11 日,第一财經記者獲悉,一則李彥宏内部講話流出。在内部講話中,李彥宏對大模型開源與閉源的路線選擇以及 AI 創業者應該專注模型還是應用等業界焦點話題,發表了自己的看法。
在講話中,李彥宏給開源大模型潑了盆冷水,稱模型開源的意義不大,它們往往是做小規模的驗證應用,并沒有經曆大算力的驗證。此外他還談到 AI 創業的話題,認爲創業者的核心競争力本就不應該是模型本身,而是應該去卷應用本身。
目前的大模型行業,有以 OpenAI GPT-4 爲代表的閉源大模型和以 Meta Llma2 爲代表的開源大模型兩股力量。後者正在快速地拉攏 " 朋友圈 ",對前者形成有力沖擊。"OpenAI 不 OPEN",也成爲業界對于明星公司 OpenAI" 不開源 " 的一句吐槽。盡管這家公司分享了大量 GPT-4 的基準、測試結果和生動的演示,但對用于訓練該系統的數據、成本或用于創建它的具體硬件或方法等相關信息 " 守口如瓶 ",對于是否開源也沒有時間表。
作爲國内大模型的較早入局者,百度也是選擇走閉源路線的一家。對于百度文心一言爲什麽不開源,今日李彥宏表示,在一年前文心剛剛發布的時候,圍繞是否開源,百度内部有過非常激烈的讨論,最後決定是不開源。這是基于當時的判斷,大家市場上一定會有開源的模型,而且是不止一家會開源。" 在這種情況下,多百度一家開源不多,少百度一家開源也不少。"
李彥宏談及目前大模型市場上主流的開源模型,如像 Llama,Mistral 其實都是有相當影響力的,國内的大模型智源、百川、阿裏的通義也都是開源的,對百度而言,開源還得自己去維護一套開源的版本,這是不劃算的。
不過,緊接着,李彥宏同時給開源大模型潑了盆冷水,稱 " 模型開源的意義其實不是很大,這些開源模型都是在外頭零零散散小規模地去做各種各樣的驗證應用,它沒有經過大算力的驗證。"
此外,他認爲模型開源也不是一個衆人拾柴火焰高的情況。" 這跟傳統的軟件開源比如 Linux、安卓等等很不一樣,由于是模型帶來的開源,我們也不知道參數爲什麽變成了那個樣子,這種情況下很難實現衆人拾柴火焰高。雖然 Llama 也鼓勵大家去貢獻各種各樣的數據、代碼,但是實際上大家明白最主要的開發者就是 Meta 這些人,它并不是一個真正由大家一起來協同開發的産品。"
他稱反觀閉源,是有真正的商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。" 其實也很簡單,大家比較一下,比如矽谷有一個優秀的人才,他有 OpenAI 的 offer,有 Meta 的 offer,有 Llama 的 offer,他會去哪兒 ? 這是非常顯而易見的選擇。"
他稱,大家以爲開源是免費的,在成本上有優勢,實際上也不是,閉源在成本上反而是有優勢的。因爲隻要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。反過來,同等參數的情況下,閉源模型的能力也是更強的。" 今天不管是在中國也好、在美國也好,最強的基礎模型都是閉源的,而各種各樣的小模型、最好的小模型,都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的,這樣也會導緻閉源在成本上、在效率上也會有優勢。"
圍繞開源閉源,業界一直争論不斷。在大模型領域,如同移動互聯網時代以蘋果爲代表的封閉模式和以谷歌安卓爲代表的開放模式,大模型因其不确定性形成了開源模式和閉源模式同時推進的基本格局。
一位大模型從業者對第一财經記者表示,如今大模型行業遠不到一家壟斷或是一家獨大的局面,無論開源、閉源,每個公司都有自己的路線選擇,總有人相信 " 開源的力量 "。開源可以降低 AI 大模型的使用門檻,因爲開源大模型意味着無數開發者可以基于大模型來開發基礎設施工具和應用,有望加速下遊行業 AI 應用的開發效率、促進生态的蓬勃發展。同時,開源意味着更多的人可以審查它,識别并修複可能的問題,從而提升了安全性。
此前,百川智能 CEO 王小川在接受第一财經記者采訪時也曾談到開源與閉源之争,王小川說,開源确實容易 " 建立人品 "," 朋友多多的 ",讓大家迅速了解和評測;同時開源也是爲商業化做準備,如果大家用起來覺得不錯,當需要更好的服務和更大的參數時,可以探索進一步的商業化路徑。
但是他認爲,開源和閉源并不像手機中 iOS 或者安卓操作系統隻能二選一,從 tob 角度,開源閉源其實都需要。他預計未來 80% 的企業會用到開源的大模型,因爲閉源沒有辦法對産品做更好的适配,或者成本特别高,閉源可以給剩下的 20% 提供服務。二者不是競争關系,而是在不同産品中互補的關系。
開源大模型對于開發者同樣有着重要意義。此前一位大模型開發者告訴第一财經記者:" 首先是即便開源大模型參數不夠大,但如果在非常大的數據集上訓練模型,那麽在性能方面也可以與參數非常大的模型競争;其次,是一些小型的企業可以用很少的預算和适量的數據将小模型微調到與大模型相媲美的程度。"
此外,由于開源模型支持不同的團隊在彼此的工作基礎上進行構建,因此開源模型的進步速度比封閉生态系統快得多。
除了談開源閉源之外,李彥宏提到,對于 AI 創業者來說,核心競争力本就不應該是模型本身。" 這太耗資源了,而且需要非常長時間的堅持才能跑出來。創業者真正的優勢應該是在某一個領域的知識、數據。"
他認爲,外界一些做模型的創業公司講的所謂的 " 雙輪驅動 " 不是一個好的模式。既做模型又做應用,勢必會分散精力。創業公司的精力和資源都是有限的,同時做兩件事情和隻做一件事情哪個成功率更高是不言自明的。在任何情況下我們都非常講專注力," 力出一孔 ",當資源有限的時候更應該專注,而不是去搞所謂的 " 雙輪驅動 "。
他舉個例子,假如說今天想找一個 " 黃色的無兜的男士泳褲 ",在任何一個今天的電商平台上都找不到,這種需求目前的技術是解決不了的,大模型如果有領域知識就可以解決,這就是靠領域知識能夠提供獨特價值的例子。市面上有這麽多模型,大的、小的、開源的、閉源的,在特定應用當中怎麽樣使用這些模型的組合,是有技巧的,這是創業者可以幹的事兒,是可以提供價值增益的。
他還提到創業者的擔心:如果用了文心或者閉源模型,做得好了就抄襲,巨頭把創業者的飯吃掉了。" 大家去看一看,在移動時代,微信沒有去吃掉拼多多,滴滴也沒有變成騰訊的一部分,它們都各自提供了自己獨特的價值,有自己非常不一樣的競争力,它們的興起都是依賴移動生态裏的一個封閉平台——微信,但是它們并不怕微信去搶它的飯碗,所以沒有必要擔心基礎模型通吃 AI 的應用。"
事實上,李彥宏這番表态的背後,大型語言模型的開發是非常龐大且處于較爲早期的階段,基于大模型開發出來的 AI 原生應用仍非常少。大模型本身是基礎底座,類似操作系統,最終開發者要依賴爲數不多的大模型來開發出各種各樣的原生應用。
目前,已經有一大批創業者奔向 AI 創業的戰場,AI 大模型有望從拼參數逐步進入到拼原生應用、拼産業落地的階段。業界預計,大模型下一個階段有望迎來應用層之戰。
此前百度表示開放一批經過全新重構的 AI 原生應用,并在内部展開内部 " 賽馬 ",所有産品都在基于原生思維進行重構。在應用層,此前科大訊飛、360 等先後發布了在工業、金融、教育、醫療、AI 數字人等領域的應用産品,開放開發者接口;百川智能 CEO 王小川對記者透露,今年内部團隊開始部署 C 端超級應用,在他看來,落地和應用方面是中國創業者的強項。