每經記者 可楊 每經編輯 張海妮
" 外界對大模型有相當多的誤解。" 近日,李彥宏的一則内部講話曝光。李彥宏認爲未來大模型之間的差距可能會越來越大。他進一步解釋,大模型的 " 天花闆 " 很高,現在距離理想情況還相差非常遠,所以模型要不斷快速叠代、更新和升級;需要能幾年、十幾年如一日地投入,不斷滿足用戶需求,降本增效。
對于行業 " 大模型之間的能力已經沒有壁壘 " 的說法,李彥宏給出了不同觀點:" 每次新模型發布,都要和 GPT-4o 作比較,說我的得分已經跟它差不多了,甚至某些單項上的得分已經超過它了,但這并不表明和最先進的模型就沒有差距了。"
他說,很多模型爲了證明自己,會在發布之後去打榜,會去猜測試題目、答題技巧,從榜單上看,或許模型的能力已經很接近了," 但到實際應用中,實力還是有明顯差距的 "。
李彥宏指出,模型之間的差距是多維度的。行業往往更關注理解、生成、邏輯、記憶等能力的差距,但卻忽視了成本、推理速度等維度,有些模型雖能達到同樣效果,但成本高、推理速度慢,還是不如先進模型。
李彥宏還表示," 在大模型時代之前,大家習慣了開源意味着免費、意味着成本低 "。他解釋說,比如開源的 Linux,因爲已經有了電腦,所以使用 Linux 是免費的。但這些在大模型時代不成立,大模型推理是很貴的,開源模型也不會送算力,還得自己買設備,無法實現算力的高效利用。
" 效率上開源模型是不行的。" 他表示," 閉源模型準确講應該叫商業模型,是無數用戶分攤研發成本、分攤推理用的機器資源和 GPU,GPU 的使用效率是最高的,百度文心大模型 3.5、4.0 的 GPU 使用率都達到了 90% 多。"
李彥宏分析認爲,在教學科研等領域,開源模型是有價值的;但在商業領域,當追求的是效率、效果和最低成本時,開源模型是沒有優勢的。
在大模型應用層面,李彥宏認爲首先出現的是 Copilot,對人進行輔助;接下來是 Agent 智能體,有一定的自主性,能自主使用工具、反思、自我進化;這種自動化程度再發展,就會變成 AI Worker,能獨立完成各方面的工作。
他還表示,雖然 " 有很多人看好智能體這個發展方向,但是到今天爲止,智能體還不是共識,像百度這樣把智能體作爲大模型最重要的戰略、最重要的發展方向的公司并不多 "。
李彥宏認爲,智能體的門檻确實很低,很多人不知道怎麽把大模型變成應用,而智能體是一個非常直接、高效、簡單的方式,在模型之上構建智能體相當方便。