(圖片來源:躍問視頻 demo)
生成式 AI 領域的技術競賽不斷加劇,已進入到 " 白熱化 " 階段。
今年以來,OpenAI 接連發布 Sora、GPT-4o、o1 系列等多款模型,引發關注。此外,Runway 發布全新圖像模型 Framer、Midjourney 準備發布 V7 版本、Claude 3.5 模型升級,而英偉達公布全新 AI 音頻模型 Fugatto。
回到國内,字節跳動、百度、騰訊等大廠接連公布大模型技術和産品進展,開始用大模型實現 " 賣雲 " 的增值。
國内大模型創業公司也在加速狂奔。
钛媒體 App 獲悉,11 月 27 日,專注于通用人工智能大模型(AGI)研發的公司 " 階躍星辰 "(StepFun),日前已悄然開啓視頻生成模型 Step-Video 内測,用戶可通過 " 躍問 " 官網的 " 躍問視頻 " 産品進行點擊申請,且第二版視頻生成模型已經在研發中。
公開資料顯示,這家行事低調的大模型獨角獸,在 8 個月内接連發布了至少 6 款基座模型,且近期多款模型因爲強悍的技術實力在國際上大放異彩。
短短一周内,階躍星辰多模态理解大模型 Step-1V、萬億參數語言大模型 Step-2 分别跻身全球權威大模型評測基準榜單 LMSYS 大模型競技場 Chatbot Arena 和 LiveBench 前列,皆位列中國大模型第一。
其中,Step-1V 在 LMSYS Chatbot Arena 上,總分跟 Gemini-1.5-Flash-8B-Exp-0827 持平;Step-2 在 LiveBench 榜單上的成績逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06 等國際主流模型,也是唯一進入榜單前十名的中國語言大模型。
(圖片來自 LiveBench 官網,截至今年 11 月 19 日數據)
" 狂飙 "600 餘天,階躍星辰建立全面模型矩陣
11 月 30 日,OpenAI 将迎來 AI 聊天機器人 ChatGPT 發布兩周年之日。
回顧過去兩年,ChatGPT 引爆了全球新一輪 AI 大模型 " 造模 " 熱潮。《全球數字經濟白皮書(2024 年)》報告顯示,目前,全球 AI 大模型數量已達 1328 個,其中美國占比最多達 44%,中國占 36%,這兩個國家已經牢牢占據大模型領域的第一梯隊。
全球 AI 大模型市場的競争格局日益激烈。
在這一輪生成式 AI 熱潮中,國内最先起跑的是創業公司。成立于 2023 年 4 月的階躍星辰,在 600 多天的時間裏,已形成行業領先的綜合技術實力。
包括近期低調内測的 Step-Video 在内,階躍星辰已經推出了 Step 系列通用大模型矩陣,涵蓋從千億到萬億參數、從理解到生成、從語言到多模态的全方位能力:
Step-1 千億參數語言大模型:兩個月一次性訓練成功,已完成充分打磨,在邏輯推理、中文知識、英文知識、數學、代碼方面的性能全面超越 GPT-3.5。
Step-1V 多模态大模型:性能比肩 GPT-4V,可以精準描述和理解圖像中的文字、數據、圖表等信息,并根據圖像信息實現内容創作、邏輯推理、數據分析等多項任務。
Step-2 萬億參數語言大模型:采用 MoE 架構,聚焦深度智能的探索,這是國内首個由創業公司發布的萬億參數語言大模型。Step-2 在語言生成上對細節有極強的控制力,模型能夠更好地理解和遵循人類指令。
Step-1.5V 多模态大模型:在 Step-1V 的基礎上進行了叠代,具備更強大的多模态理解能力,實現了從圖像理解到視頻理解的跨越升級。
Step-1X 圖像生成大模型:具有強大語義理解與圖像創意實現能力,可用于各種圖像創作和設計任務。
Step-Video 視頻生成大模型:支持文生視頻,可生成 1080P 長達 10s 的高清視頻,在語義理解、指令遵循、運動、中國風美學生成上效果突出。目前模型已經接入 " 躍問視頻 " 并開始内測。
從上述兩個 demo 片段中,我們可以看到,無論是語義理解能力,細節運動符合物理規律,還是清晰度,階躍星辰的 Step-Video 視頻生成模型均達到業界先進水平。
事實上,在大模型 " 六小虎 " 中,階躍星辰以多模态模型技術實力強勁著稱。根據階躍星辰創始人、CEO 姜大昕的規劃,階躍星辰實現 AGI 的技術路線是:" 單模态 — 多模态 — 多模理解和生成的統一 — 世界模型 — AGI"。
他曾多次強調,隻有解決了多模态理解生成一體化,才能徹底建立一個世界模型,再往後才能跟具身智能結合,最終實現 AGI,以此提升社會、經濟産業的能力與價值。
2028 年超 4 萬億規模,大模型加速技術落地
據研究機構 IDC 最新數據顯示,預計到 2028 年,全球 AI 産業支出将達到 6320 億美元(約合人民币 4.58 萬億元),幾乎是當前的兩倍,5 年間複合年增長率 ( CAGR ) 達 29%。
其中,生成式 AI 成爲最大的增長引擎,到 2028 年該領域投資支出高達 2020 億美元,占整個 AI 支出的 32%,CAGR 達 59.2%。
不過,當前生成式 AI 産業仍處于非常早期的階段。
中國工程院院士、北京大學博雅講席教授、鵬城實驗室主任高文認爲,如果以 " 人 " 來相比,AGI 現在可能還是剛剛會走路的幼兒狀态。但從使用角度看,AI 已經能解決生産、社會、服務的問題,可以先用起來,沒有必要等到十全十美再去用,要把它逐步的開發、完善、叠代。
越來越多的開發者和企業開始基于階躍星辰的大模型矩陣打造 AI 應用。階躍星辰開放平台逐漸形成了一個大模型 " 生态夥伴圈 "。金融财經、内容創作、消費娛樂等領域的頭部機構紛紛跟階躍星辰達成技術合作。其中,财聯社跟階躍星辰共同打造了國内首個千億參數多模态金融大模型 " 财躍 F1 金融大模型 "。
開發者則通過階躍星辰的 Step 系列大模型嘗試新的産品形态。獨立開發者趙純想将包括網紅 AI 應用 " 胃之書 " 在内的三款産品都接入了階躍星辰 Step 系列大模型,原因是胃之書早期對國内所有大模型做了産品 AB test 測試,他發現使用階躍星辰的模型,用戶付費率最高;AI 心理療愈應用 " 林間聊愈室 " 則是基于階躍星辰多模态大模型的圖片理解能力,上線了呼聲已久的 AI 識圖功能,用戶可以跟小動物分享自己的生活場景、狀态等,林間聊愈室 CEO 李神龍表示,接入新功能之後,比較明顯的是付費率确實上漲了。
下一步,我們相信,階躍星辰這類堅持 AGI 底層技術探索,加速模型應用落地的公司,将成爲 AGI 時代的關鍵 " 推手 ",同時也是 AGI 産業的技術領先者。
智能階躍,十倍每一個人的可能。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)