近期,AI 行業正站在一個關鍵的轉折點上。曾經引領大模型發展的規模法則(Scaling Law)似乎已觸及其天花闆,即便是像 OpenAI 這樣的行業巨頭,在推進 GPT 系列模型的叠代時也遭遇了前所未有的挑戰。GPT-5 的一再推遲發布,讓業界開始重新審視規模法則的有效性。與此同時,高質量文本數據的稀缺、算力成本的居高不下,以及硬件和算法優化速度的滞後,共同構成了當前 AI 大模型發展的困境。面對這一現狀,行業内外都在積極探索新的出路,以期在規模法則之外找到推動 AI 技術持續進步的新動力。
規模法則瓶頸?
很長一段時間以來,規模法則就是通往 AGI 的指路明燈。2020 年,OpenAI 通過《Scaling Laws for Neural Language Models》這篇論文讓大家熟知了規模法則并逐漸奉爲圭臬。
然而 GPT-5 的一再跳票,讓大家開始懷疑規模法則是否能繼續引領大模型成長。
The Information 指出,OpenAI 下一代 ChatGPT 5 的訓練出現了重大瓶頸,原因之一是高質量文本數據越來越少。據 OpneAI 内部人員透露,GPT 系列模型更新緩慢,即将推出的下一代旗艦模型 Orion 并沒有實現質的飛躍,雖然性能上超過了以往模型,但相較于從 GPT-3 到 GPT-4 的叠代,改進幅度縮小,OpenAI 正在轉變策略。
當規模法則遭遇瓶頸,即擴大模型的規模和增加算力無法再像大模型發展初期那樣顯著提升模型的能力時,這表明我們已觸及了當前技術框架下的極限。這一現象的原因可能在于,随着模型規模的增大,所需處理的數據量和計算複雜度呈指數級增長,而硬件和算法的優化速度卻未能與之匹配,導緻邊際效益遞減。
據了解,被稱爲 "AI 六小虎 " 的六家中國大模型獨角獸中,已有兩家逐步放棄預訓練(依賴規模法則,成本高昂)模型,縮減預訓練算法團隊,轉而聚焦 AI 應用的發展。
瑞銀證券中國科技軟件分析師張維璇告訴動點科技:" 大模型後面的發展,确實看到不同的創業公司采取更加差異化的經營方式。現在還在做大模型參數量進一步擴展的公司,其實數量在慢慢變少。确實有更強的算力儲備、人才密度、成本優勢的雲廠,他們可能會在後面擴展階段做更多的努力。但對于 AI 創業公司來講更加聚焦于産品層面,對算力需求不是很強的前提背景下,他們也可以通過對于一些檢索增強生成的技術,監督微調、強化學習,通過後訓練階段,對算力要求并不大的背景下,他們也依然可以把自己的模型在垂直領域做更好的适配,包括 To C 的産品做更好的打磨。從底層大模型的發展來講,後面看到各個廠商的差異化會做更多不一樣的嘗試。"
她指出在未來數據這個 " 金礦 " 會被更多的挖掘,就向大模型廠商最開始聚焦規模法則一樣,後訓練也有很大的 " 金山 " 可挖掘。
另外,她表示,從最近跟進的一些國内大模型廠商的進展來看," 他們目前還是在多模态方面會做更多的努力。因爲之前還是文生圖或者文生視頻,從單一模态到多模态的情況,後面他們希望可以做到從多模态(放圖片或者視頻進去生成)到多模态,這樣不管是輸入還是輸出,用多模态這個場景都可以做。所以我覺得對于中國包括海外來講,這也是後面大模型進展的新方向。"
視頻模型開卷
在規模法則逐漸觸頂的關頭,居高不下的算力成本使廠商們開始緊鑼密鼓尋找合适的大模型落地場景。事實上,在 AI 視頻模型的賽道上,已經開始百花齊放。目前,快手可靈、生數科技 Vidu、智譜清影、阿裏通義萬相視覺模型等國産 AI 視頻模型,都在逐步面向 C 端用戶開放。
快手視頻生成大模型 " 可靈 " 視頻生成大模型于 6 月初發布。6 月 21 日," 可靈 " 正式推出圖生視頻功能,支持将任意靜态圖像轉化爲生動的 5 秒視頻,搭配創作者輸入的不同文本,可生成多種運動效果。可靈還同步發布了視頻續寫功能,支持對已生成的視頻一鍵續寫和多次續寫,單次可讓視頻延續約 5 秒,最長可生成約 3 分鍾視頻。
8 月 31 日,MiniMax 發布了其首款 AI 高清視頻生成模型技術 abab-video-1。據 MiniMax 官方公衆号披露,在視頻模型上線海螺 AI 的首月,海螺 AI 網頁版訪問量增速超 800%,用戶覆蓋全球超 180 個國家和地區。
當月,字節跳動在蘋果、安卓等應用商店上架 " 即夢 AI"APP,面向用戶下載使用,并上線付費會員服務。9 月 24 日,字節跳動旗下火山引擎在深圳又發布了兩款視頻生成大模型:豆包視頻生成 -PixelDance 和豆包視頻生成 -Seaweed。
11 月 8 日,經過智譜升級後的清影支持任意比例的圖像生成視頻,并且具備多通道生成能力,同一指令或圖片可以一次性生成 4 個視頻,還可以生成與畫面匹配的音效。
即便如此,張維璇不認爲上一代 AI 視覺公司會被新的時代所颠覆,她指出,很多視頻類的公司可以通過 AI 更好的降低自己的視頻制作成本,把 AI 當作生産工具,幫助自身更好的在未來獲得更多收入的可能性。
東吳證券在今年 8 月發布的研報也提到,在 AI 滲透率爲 15% 的中性假設下,中國 AI 視頻生成行業的潛在空間爲 3178 億元;在全 AI 模式下,電影、長劇、動畫片和短劇的制作成本,相較傳統模式将下降超 95%。
張維璇認爲 AI 給這些視覺類的公司打開了一個新的增長空間,也是他們很好的效率工具。" 最近也可以看到領先的頭部短視頻平台、廠商,他們也通過很多文生視頻等等新的工具,也可以看到他們在相對較低和可控的成本下就可以生産出來,并且快速地生産出來很多高質量的視頻。特别對于一些 UGC,平台上面有很多個人或者 KOL 小團隊的平台,他們利用 AI 的制作工具可以很快地生産相應作品。"
不得不說,國産 AI 視頻模型的快速發展和應用,不僅爲内容創作者提供了強大的工具,也爲整個行業開辟了新的增長空間。