大模型之間的差距會越來越大!
李彥宏最新内部講話曝光,一時間引發行業熱議。
畢竟在當前各種大模型橫掃榜單測試集、多項得分超過 GPT-4o 的現象中,很容易給人一種假象:下一個 GPT-4o、下一個 OpenAI 就要誕生了。
爲什麽會這麽說?李彥宏進一步解釋道,大模型的天花闆很高,現在距離理想情況還相差非常遠,所以模型要不斷快速叠代、更新和升級。
這背後需要能幾年、十幾年如一日地投入,不斷滿足用戶需求,降本增效。
除此之外,他還表示開源模型效率不高,解決不了算力問題,而智能體是大模型最重要的發展方向。
百度一直以來作爲大模型應用的先行者,掌舵人李彥宏此次談話無疑也是給行業帶來一份實際意義上的參考。
一起來看看他到底說了什麽。
李彥宏内部談話曝光:三個大模型認知誤區
内部談話中李彥宏提出了三點思考,正好回應了當前正受關注的認知誤區:大模型之間的差距在縮小嗎?大模型技術已經接近天花闆了嗎?爲什麽說商業化模型更有性價比?
首先,大模型差距不是越來越小,而是越來越大。
一上來,李彥宏就反對了外界對大模型能力差距縮小的看法,認爲模型之間的差距仍然顯著,并且會越來越多。他指出,盡管新發布的模型在測試集上表現良好,但這并不能證明它們與最先進的模型如 GPT-4o 之間的差距已經縮小。
他解釋說,很多模型在發布後,通過打榜、猜測試題目、答題技巧,從榜單上看 ,也許模型的能力已經很接近了," 但到實際應用中,實力還是有明顯差距的。"
一方面,模型之間的差距是多維的。模型能力的評估除了包括理解、生成和邏輯推理等多維度,以及相應的成本和推理速度。此外,對測試集的過度拟合可能導緻對模型能力的誤解。
如今大模型已經來應用階段,他認爲,真正的衡量标準應是模型在實際應用中能否滿足用戶需求和産生價值。因此在百度實際使用過程中,他不允許技術人員去打榜。
另一方面,模型天花闆很高。今天能做到的,距離想要實現的效果還很遠,所以模型還需要不斷去叠代更新。隻有持續幾年甚至十幾年地投入,才能讓模型滿足用戶需求、滿足場景、滿足提升效率或降低成本等需求。這也是保持競争力的關鍵
由此李彥宏認爲,所謂的領先 12 個月或者落後 18 個月沒有那麽重要。哪怕你能保證永遠領先競争對手 6 個月,那就赢了。
其次,開源模型解決不了商業應用中的效率問題。
在講話中,李彥宏強調,開源模型需要用戶自行部署和維護,這導緻其 GPU 使用率低,無法有效分擔推理成本。而閉源模型通過用戶共享資源和分攤研發成本,實現了更高的效率與效果。
目前文心大模型 3.5、4.0,GPU 使用率都能達到 90% 多。
正如前面所言,評價一個模型,維度是多方面的,不僅是看到榜單上的多項能力,也要看效果看效率。當大模型加速駛入商業應用之後,在追求高效率和低成本的情況下,開源模型并沒有優勢。
李彥宏明确表示,在大模型時代,算力的高效利用是決定模型成敗的關鍵,而開源模型無法解決這一問題。
最後,智能體是大模型最重要的發展方向,低門檻讓應用轉化變得更加直接和高效。
大模型發展過程主要會經曆哪幾個階段?在内部講話中, 李彥宏給出了明确的答案。
首先是的 Copilot 階段,輔助人類進行操作;接着是 Agent 智能體階段,具備自主使用工具和自我進化能力;最後是 AI Worker 階段,能夠獨立完成多種工作。
其中智能體作爲大模型最重要的發展方向,相比于大家都在關注的多模态,尚未形成行業共識。但在百度的産品中,比如文心智能體平台 AgentBuilder 已經讓智能體的潛力已經開始被認可。
而其中低門檻這一特性,讓從模型到應用的轉化變得簡單,促使大量新智能體在百度平台上被創造。
李彥宏強調,借助百度的用戶基礎和需求,智能體可以更好地滿足市場需求,推動其進一步發展。
百度智能體實踐已進入深水區
總結下來,李彥宏談到的這幾點思考,如果說前兩點,還說的是現在,說的是當下,那麽智能體就代表着未來。而這一切的背景前提,正好同當前大模型發展駛入深水區階段不無關系。
如今随着基礎模型更新速度放緩,大模型應用逐漸深入産業,企業面臨着更複雜的市場環境和技術挑戰。簡單的技術叠代已不足以滿足市場的多樣化需求。
人們對大模型的期待與看法也随之改變,模型的參數量以及榜單分數不再作爲模型能力的核心指标,開源不開源其實也并不重要。
産業界對 AI 的需求,已經不僅僅是單純的技術追求,解決實際問題才是衡量大模型的唯一标準。在這一過程中,更多問題和挑戰不容忽視,比如推理與算力的成本問題,以及處理業務效率等。
那麽本身在行業長期且持續投入的百度,面對當前這一命題,自然是給中國衆多大模型提供了一份發展參考。
答案就是智能體。
所以這次李彥宏内部談話,其實也不僅僅是關于行業認知,還有來自百度智能體實踐的有力驗證和體現。
在此之前,李彥宏在多次講話中強調,智能體代表了 AI 時代的未來趨勢。
作爲一個幾乎 " 放之四海而皆準 " 的大模型應用,智能體不僅門檻低,甚至不需要編程技能,就能讓用戶輕松開發出功能強大的應用。李彥宏形象地将智能體比作 "AI 時代的網站 ",預示着它将形成一個數百萬量級的龐大生态。這種廣泛的應用潛力使得智能體成爲各行各業的 "Super APP",推動了 AI 技術的普及和應用。
與之相應的,是百度在智能體領域的布局顯著。
通過文心智能體平台AgentBuilder,百度已經吸引了 20 萬開發者和 6.3 萬企業入駐,并在 2023 年 7 月免費開放文心大模型 4.0。這一舉措使得開發者在構建智能體時可以靈活選擇适合的模型版本,大大降低了開發的門檻。
并且在短短時間内,百度智能體展現出大模型應用強大的潛力。據百度 2024 年 Q2 季度财報,智能體在百度生态的分發量正在快速上升,7 月日均分發次數超 800 萬,較 5 月翻倍。
熱門智能體包括内容創作、性格測試和日程規劃等,涵蓋教育、法律及 B2B 等多個行業。百度的智能體生态吸引了 1.6 萬家商戶參與,形成了用戶、開發者和服務商共赢的局面。
李彥宏強調,智能體的發展不僅依賴于技術創新,更需緊密結合用戶需求。随着用戶對智能體的需求不斷上升,使得這些智能體能夠快速叠代。而隻有智能體生态持續擴展,才能推動 AI 技術在各個領域的深入應用。
在大模型應用逐漸深入的當下,百度的智能體實踐無疑爲行業提供了重要的借鑒和啓示。
大模型熱潮進入洗牌期
今年以來已經明顯感知到的是,随着大模型技術的不斷發展和應用的深入,行業正在進入一個新的階段。這個階段的特點是,大模型玩家格局已基本形成:有自研和可持續研發大模型能力的玩家開始向頭部聚集。
與此同時,大模型應用和落地開始進入生态建設期。
越來越多看好大模型前景的創業者,不再會糾結是不是要自研或者自建大模型的問題,而是更加關注如何利用現有的大模型解決實際的痛點需求和問題。
在這個過程中,智能體作爲最小的 AI 應用實現方式,展現出了巨大的潛力。它低門檻輕量化,能夠快速在行業中鋪開并實現覆蓋,滿足效率和成本兩大需求。随着基礎模型的不斷增強,智能體應用可以變得更加簡單和廣泛。
這也是李彥宏看好智能體的核心原因所在。
通過李彥宏講話,我們可以看出百度的戰略重點正在發生轉向。卷基礎模型的階段已經過去,現在更加重要的是如何通過智能體構建起豐富多彩的應用生态,讓生态成爲百度大模型、文心的護城河。
這意味着,百度将更加重視智能體在應用生态中的價值和意義,通過不斷完善智能體平台和工具,吸引更多開發者和企業加入,共同打造一個繁榮的 AI 應用生态。
未來,智能體将不僅限于内容創作和日程規劃等基本功能,會拓展到更多專業領域,如醫療、金融和法律服務等,爲用戶提供個性化和高效的解決方案。
爲了實現這一願景,企業需要持續投入資源進行技術創新與叠代,不斷優化算法和提升用戶體驗。
當然,在這個過程中也會面臨一些重要的課題,比如數據隐私與安全性,智能體的管理和維護等。但是,任何一項技術應用駛入深水區都會面臨這樣那樣的挑戰。
随着智能體生态的不斷壯大,百度正引領行業走向一個更加智能化和高效的未來,爲各行業帶來新的機遇與挑戰。