2023 年,OpenAI 引領了科技圈久違的興奮,創業者感到有奔頭的同時,卻也随着 AI 模型的一再進化,感受到了壓力。
在春節前夕,算力、模型、應用等領域的大模型創業者,齊聚在一場創業者社群的活動上,切磋各自在不斷進化的大模型中找到的空間。面對呼之欲出的 GPT-5 和 Llama3,他們也有新的思考。
站在模型層面,差異化很難,方向幾乎是明确的——增強推理能力和多模态。也有技術路線的分野,比如阿裏雲通義實驗室智能對話負責人李永彬透露,目前在思考是否能把搜索增強這樣的外挂能力,做到模型裏,進一步提升模型的可用性。
但站在應用層,多的是非共識和機會。比如,跑得最快的一批創業者,已經實現了一定程度的商業閉環,得出的結論甚至有些意外:「大模型含量」不宜過高。
這群下場做大模型的實幹家也談到了行業内最真實的情況。智譜 AI COO 張帆道出,今天的榜單其實不反映真實問題,GPT-4 可能連榜單前 10 名都進不了。他認爲,這種情況下,2024 年一定會發生從模型爲王到價值爲王的變化。
百川智能聯合創始人洪濤則更關心成本,他表示,一年下來苦哈哈做各種私有化項目,到底掙多少錢,其實内心沒把握。在這一點上,大家也探讨了雲計算廠商能否在整個行業沒有商業模式之前,降低算力成本的路徑,讓該花的錢少一點。
近日,阿裏雲創業者社群在北京舉辦創業者之夜活動|阿裏雲
在「創業者之夜」,各位大模型的先行者分享了各自對行業的「預言」;AI 應用的創業者們,也分享了對于大模型的「焦慮」。
01 2024,大模型往哪走?
2023 年,阿裏雲李永彬遊走于大模型業務一線。一整年忙活下來,他發現:最初,大模型讓「AI 解決問題」這件事的效果從 20 分提高到 60 分,就能夠驚豔所有人,但是對于很多問題,60 分和 0 分差不多。因爲在一些應用場景,沒辦法拿 60 分的産品上線,效果到不了 90 分,客戶可能也不會買單。
這也是 2023 年大模型創業者們共同的體感。從興奮回歸到理性,背後是共同的困惑——大模型還不夠通用,它會不會像上一波 AI 一樣,盡管展現出驚人的能力,但落到場景時仍舊需要逐個項目定制化?
大家自然就産生了 2024 年對大模型的第一個期待——通用能力進一步提升,甚至期待模型在一些複雜場景能直接做到 90 分。
這種可能性不是無迹可尋。IDEA 研究院講席科學家張家興認爲,從目前 OpenAI、谷歌等大廠對下一代大模型的判斷,大模型能解決複雜問題會成爲接下來進化的方向。
AlphaGeometry: An Olympiad-level AI system for geometry|圖片來源:DeepMind 官網
就在兩周前,谷歌 DeepMind 推出的 AlphaGeometry(阿爾法幾何)AI 系統,已經能在 30 道國際奧數題中做對 25 道,接近人類水平(人類金牌得主平均做對 25.9 道)。像這樣能解決奧數級别的幾何問題,被視爲邁向更先進、更通用 AI 的重要裏程碑。在 IDEA 研究院張家興看來,「奧數就是複雜問題,問題的描述很複雜,求解過程、證明過程也很複雜」,能解決複雜問題是模型變得更通用的表現之一。
阿裏雲創業孵化事業部總經理李中雨認爲,從 GPT-5 目前釋放的信息看,模型的泛化能力在提升,解決複雜任務的能力也在提升,甚至接下來 GPT-5 可以解決 15%-20% 人類的任務。
在提升模型的通用性上,也有新思路。
一位來自模型廠商的與會者分享,最近絕大多數企業落地大模型時都會用到 RAG(搜索增強),從而将大模型和私有數據結合起來,提升模型可用性。但作爲模型側的開發者,也在探索算法創新,通過算法創新提高模型的學習能力,把像 RAG 這樣的外挂知識庫囊括進去,從而減少對模型數據訓練的依賴。換言之,通過算法創新,以期讓模型像人類學習一樣,看一本書就可以理解知識,而不需要看所有書來理解一個問題。
在這一點上,GPT-5 提供了很好的示範。智譜 AI 張帆認爲,更強大的推理能力讓處理複雜任務成爲可能,同時也帶來了非常強的泛化能力。模型會在各個行業場景都能有很好的 Zero-Shot、One-Shot 能力(給模型一個例子甚至不給例子,它就可以湧現出對應的能力),從而減少對訓練數據的依賴。通過小數據集的訓練,就可以把模型引入到更多更垂直的領域。如此一來,可以降低客戶使用模型的門檻,增加其可用性。
除了通用性,多模态能力也被期待在 2024 年能有更大突破。
去年底,從 GPT-4 到谷歌 Gemini,已經充分展現了大模型的演進,拓展以大語言模型爲核心的更大體系的 AI,必然會涉及多模态能力。
張家興預判,就像 2022 年底 ChatGPT 的出現,導緻 2023 年所有人都在做大語言模型一樣,2024 年整個業界可能會聚焦多模态。這并不隻是因爲多模态能帶來更強的能力,更因爲多模态的應用場景多,在端側比如車和機器人的場景,多模态非常重要。
在多模态的技術實現上,也有一些技術融合的新視角。
在多模态領域做探索,中科深智創始人成維忠注意到前段時間圖靈獎得主 Lecun 的一個采訪,他并不認同現在大家做多模态的技術路線——把圖片視頻還原爲像素,Lecun 認爲未來的多模态訓練是應該以表征事件爲主。
在這一話題的讨論上,與會者一方面認爲,ChatGPT 也不是規劃出來的,技術路線可能是幹出來的,能用今天的技術落地往前走、不斷改進是前提。另一方面,盡管路線之争的存在,但也不是不能調和的,有很多中間的路線可以走,是連續的。比如,張家興分享了 IDEA 内部的實踐,稱稱目标識别等計算機視覺特征是可以作爲多模态大模型的輸⼊,實踐下來的效果⾮常好。
從左到右分别是阿裏雲創業孵化事業部總經理李中雨;智譜 AICOO 張帆;百川智能聯合創始人、總裁洪濤;元璟資本管理合夥人劉毅然;IDEA 研究院認知計算與自然語言講席科學家張家興、通義實驗室對話智能負責人李永彬 | 阿裏雲
02 2024,大模型如何落地?
如前所述,對于大模型接下來的趨勢預判,推理能力和多模态能力的提升成爲清晰、明确的目标。但談到 AI 應用,更多是非共識的思考,創業者一緻認爲需要在非共識中尋找機會。
就拿大模型落地應用要考慮的第一件事——模型選型來說,目前也還沒有達成共識。智譜 AI 張帆笑稱,以現在模型評測卷出天際的背景下,「OpenAI 的 GPT-4 都排不到模型評測榜單的前兩頁」。
的确,幾個月以來,不少模型創業者都向極客公園表達了類似的觀察:模型評測榜單不反映真實情況。在「模型爲王」的願景下,的确會出現提前讓模型「看題」、「背題」來獲得高分的情況。但更重要的是,當涉及到千行百業的不同場景,很難用一套标準來評價模型的可用性。
實踐過後,大家更認同在一個個真實的具體場景裏不斷測試評估。比如,獵聘在 + 大模型的探索上,最大的研發成本就花在測試不同的模型上。獵聘 CEO 戴科彬表示,對于什麽場景用什麽模型、多大尺寸的模型最高效,沒有标準答案,就連評價标準也要根據情況調整。
除了模型選型,模型落地也開始出現一些可操作的判斷标準。無論是在原有應用裏 + 大模型,還是一些 AI Native 應用的探索,都出現了能形成商業閉環的可能性。
這裏首先要考慮大模型技術分布的獨特性。元璟資本管理合夥人劉毅然認爲,AI 應用存在巨大的不确定和非共識機會,這與這一波 AI 技術的特點有關。
移動互聯網時代,應用的底層基礎設施是一樣的,都是基于蘋果 iOS 和 LBS 定位來做産品。相比之下,大模型應用則是一個個垂直優化的過程,底層模型哪部分用開源版、哪部分微調、調整哪些問題,再視情況優化功能和應用。創業者需要充分懂技術,再做産品的封裝,這個過程存在很大優化空間和機會。
這就提出了探索 AI 應用的第一條原則—— TPF(技術産品匹配),百川智能創始人王小川在極客公園創新大會 2024 大會上曾提到過這個名詞,指的是在現有大模型技術不完美時,先明确「這樣一個技術适合什麽樣的産品」,而不是産品經理洞察市場有什麽需求,回來就開始做。
因爲從大模型到 AI 應用,「今天最大的挑戰不是找到『什麽不行』,這件事不難,人人都能夠做到。難的是能找到它『什麽行』,找到模型能力和業務的最大公約數,變成正向循環。」智譜 AI 張帆認爲,這會成爲 2024 年大模型落地的重點。
盡管這樣的實踐可能不是投資人尋找的 AI Native 應用,但是務實地看,通過在可用場景裏,基于模型和工程化手段把大模型應用産品化,數據和客戶反饋的飛輪會推着 AI 應用向前叠代。百川智能聯合創始人洪濤提到了一個有趣的觀察,做 AI 應用的創業者甚至覺得以當前大模型技術成熟度,AI 應用「含大模型量」不宜過高。
在遊戲領域,昆侖萬維集團董事長兼 CEO 方漢有類似的觀察。通過純 AI 大模型直接生成 3D 遊戲内容,會造成面數特别多、規格不匹配等問題。這時如果換一個思路,把傳統的一些簡單動畫工具,融合進 AI 大模型的工作流之後,産品的可用性就大大提高。
在他看來,什麽好用就用什麽,拼出對用戶最有價值的工作流,這是作爲 AI 應用開發商的價值所在。
看得出,在原有應用裏 + 大模型、探索更好的工作流,是把大模型智力變成生産力最直接的方式。智譜 AI 張帆認爲,這也是 2024 年産業關注的重點。
與此同時,一些令人驚豔的 AI Native 應用也開始出現。
就像移動互聯網技術下,出現随時随地刷短視頻的用戶需求一樣,大模型技術下也開始出現一些獨有的場景。比如一位 AI 應用投資人現場分享了一款還在定向邀測的海外應用 Can of Soup,一款想象力社交軟件。用戶利用 AI 生成虛拟圖像,發布在網站上,互相評論,還可以邀請朋友進行「想象力」共創、點評,這款産品可以類比爲「想象力版 Instagram」。
「這款應用在海外 DAU 增長非常快,不知道最後能不能成,但是非常有意義的探索,代表不僅現實的生活可以分享、可以社交,你的想象力也可以被社交,這就是非常典型的 AI 原生的應用,發現了新的行爲模式」,他補充說。
除了像 Can of Soup 這樣捕捉新技術下的人類新需求,新技術也給熟悉的場景帶來了更好的解決方案,爲用戶帶來更易用、好用的體驗。
就拿現在最火熱的智能體來說,智譜 AI 張帆認爲,很多 GPTs 能做的事情非常淺,很難用作生産工具。這些 GPTs 背後的流程大體是按照人的理解邏輯來執行,先做分類、再做模型、再做任務,但是這種智能體運行的方式是受限的,他認爲,「嚴格來講,這種外挂工程的方式不算是 agent,隻是大号的模型應用」。
相比之下,他發現字節跳動在海外推出的 Coze 玩法不一樣,同樣是 GPTs 類應用,Coze 的模式是利用背後大模型的遞歸和叠代的能力和表達力,這是更加原生的智能體,效果也更好。
張帆稱,這是他看到比較興奮的方向,能夠用更簡單的方式、更通用的方式,不需要微調,僅僅用基礎的表述就能夠解決真正的複雜問題,把從模型到應用之間的 100 公裏降到 100 米。但也有前提,像 Coze 這樣的原生模式,高度依賴背後的模型能力,模型強大到足夠通用,才可以實現。
智譜 AI COO 張帆在活動上做分享|阿裏雲
除了軟件類 AI 應用,結合端側場景的應用也值得期待,尤其機器人領域。說起 2023 年最眼前一亮的應用,張家興認爲是谷歌的 RT-2(Robotics Transformer 2,一款機器人大模型),看到了⽤⾃然語⾔定義任意機器人任務的曙光。他認爲,⼤模型在機器⼈領域正在期待 ChatGPT 時刻。
元璟資本劉毅然舉了一個例子,過去機器人領域有一些常規,比如用數學規律來描述複雜動态體的運動,現在,大模型對于像這樣的數學描述過程有放大作用,但距離大模型真正進入機器人或者手機、車、AI Pin 等硬件,可能還需要些時間。
「天上的大模型能否落在地上的設備上面,是值得期待的」他說道。盡管通用的物理世界大模型的價值最大,是科學家夢寐以求的,但在前面加合适的定語,是創業者今天就可以做、也可以有收獲的。難點在于,前面怎麽加定語,能符合今天的技術階段,也能把商業化和産品結合在一起,不停向前進。
03 2024,大模型「基建」的意義
有了對 AI 應用百花齊放的期待和判斷,創業者也對整個大模型的技術體系寄予新期待,尤其是數據、算力和開源算法。
數據被視爲模型訓練、微調等動作産生效果最重要的因素之一。在獲取高質量數據上,方漢提出了不同的思考。在他看來,很多大模型有更快的方法獲取數據,比如通過用 GPT-4 做「教練」來獲得,但是在數據獲取方面,團隊應該有「長期主義」精神,不然「很難走遠」。
昆侖萬維董事長、CEO 方漢在交流環節分享昆侖萬維 + 大模型的實踐|圖片來源:阿裏雲
在對比了全球市場後,昆侖萬維方漢認爲,垂類數據是中國公司上場和發力的方向。有了垂類高質量數據,才有機會在垂直場景裏面做到 SOTA(指前沿、第一梯隊的模型),率先獲得垂直場景的紅利。
在算力層,成本成爲主要的關注點。
百川智能洪濤坦言,大模型商業模式的探索有相對長期的試錯過程,雲計算層面繼續突破、攤薄創新成本,是眼下比較關注的方向。
在這一點上,阿裏雲公共雲總裁劉偉光認爲雲和 AI 的結合會逐漸解決這個問題。
雲計算對傳統 IT 的意義,和融合AI的意義完全不同。AI 和雲是魚和水,密不可分,二者的結合是 AI 應用的催化劑。同時,雲計算能力的不斷演進,包括 GPU 算力、配套的計算存儲、網絡能力的演進,會對 AI 産生非常大的支撐。
「在談AI原生應用之前,其實有一點被忽略了—— AI 是雲的原生應用。二者的結合還有很大優化空間」他說道。随着大模型包括 AIGC(應用)更加細分,對算力的需求也會逐漸細分化,而不是簡單粗暴地購買算力,這也是阿裏雲不斷探索的事情。
在這一點上,雲、端結合的方式也被寄予厚望,昆侖萬維方漢認爲,降低模型推理成本,要結合端側推理,手機側可以做小參數量模型的推理,和雲端大參數量模型推理結合起來。
算法層面,Meta 開源的 LLaMA 和 Llama2 爲産業模型發展提速,帶來了繁榮的開發者生态。不久前,Mistral 創始人也袒露借鑒了 Llama2 的開源模型,但開發者普遍稱,Mistral 的效果實際用下來要比 Llama2 更好。
國内模型廠商也越來越多地選擇開源模型,但也有創業者表示,不确定國内尤其是大廠開源模型背後的考量,會不會隻是一時的。比如,獵聘戴科彬就認爲,阿裏雲開源的 72B 大模型效果非常好,但也好奇其背後的思考。
在創業者之夜上,阿裏雲市場總裁劉湘雯直面這一提問。她表示,阿裏雲會持續開源,這并非僅僅爲了公益,而是基于對商業的判斷。
阿裏雲創業者之夜活動現場|阿裏雲
在這場創業者活動中,極客公園看到了共識,也看到了更多共識的觀點在嘉賓之中激烈碰撞。而這恰恰代表了由大模型引發的新一波 AI 浪潮中所蘊含的機遇。你可以想象,在 20 年前移動互聯網剛剛興起的時候,在類似活動,同樣充滿了相同的争論和見解。
不同的是,變革的「基建」從運營商,變成了現在以阿裏雲爲代表的雲計算廠商。在大模型時代,阿裏雲不僅要自己下場「摸清」大模型上下遊的真實情況,更需要在這樣的創業者之夜活動中,和大模型行業的「玩家」共同找到行業發展的方向,根據後者不斷變化的需求,增加阿裏雲「AI 基建」的各種能力,來和創業者們一起成長、成功。
大模型時代,「計算,爲了無法計算的價值」有新的内涵,在阿裏雲舉辦的創業者之夜活動上,這群先行者率先開始探索最開放的技術體系裏,新的變化。
寫在最後:
創業者之夜活動由阿裏雲創業者社群舉辦。社群聚集中國最前沿的技術創新者,聚焦雲與 AI 技術方向、以及 AI 在産業中的落地應用等核心主題,發起各類技術及産業閉門活動與研讨,與社群成員形成長期共創體系,與技術創新者們共同成長。