這兩天,想必哥幾個的首頁已經被 Sora 的各種動态刷屏了吧。
運氣好已經用上了的,已經開始一頓輸出了,但也有運氣不好的,到現在還擱外邊兒排隊呢,就比如差評君。
我跟大夥兒一樣好奇,這 Sora 跟咱們國内的視頻生成應用相比,到底誰更勝一籌?
結果您猜怎麽着,老外比咱還着急, Sora 發布當天就迫不及待拉了個橫評,把 Sora 和 HailuoAI 對比了一波。

這個 HailuoAI ,就是咱們熟知的海螺 AI 海外版,背靠國内 "AI 六小龍 " 之一的 MiniMax 。
有一說一,這确實讓差評君有些意外。
倒不是質疑實力,而是沒想到 Sora 前腳剛上線,後腳就有人拿海螺 AI 來打擂台,這怎麽不算是一種自信呢?
而差評君也去查了些資料,發現海螺 AI 在海外是真挺吃香。
數據顯示,自打 8 月底推出視頻模型以來, HailuoAI 連續在 9 月、 10 月拿下了 AI 産品榜 · 全球增速榜的 Top1 。
我順手又在 X 上多翻了翻,發現關于 HailuoAI 的話題讨論非常活躍,時不時就有老哥把自己在 HailuoAI 上生成的大作發出來。
甚至還有人因爲擠不進 Sora ,感歎還好有 HailuoAI 可以用。

我已經不止一次見到過,來自歐洲和英國的用戶說雖然 Sora 用不了,但是有 HailuoAI 就很好。
千言萬語彙成一句 HailuoAI nb(向左滑動查看更多)






所以差評君有了一個非常大膽的想法。
既然 Sora 是暫時用不上了,那咱不如借着海螺 AI 的視角,看看國産視頻模型跟 Sora 之間,到底能過個幾招。
恰巧,前幾天 MiniMax 剛給自己的視頻模型進行了一波增強操作,估計早就等不及要跟 Sora 碰上一碰了。
爲了防止還有人不清楚海螺 AI 的實力,差評君在這先給大夥兒預熱一波。
這個視頻是我從海螺 AI 的官方那找的,畫面質感和連貫性沒得說,視頻裏的人物和背景也基本看不到扭曲、變形和卡頓的情況。
特别是小醜由遠到近,人物和背景焦點的轉化看着也很絲滑。

當然,官方精選出來的咱也不能全信,所以我又随機找了幾個路人老哥做的視頻。
真不是我瞎吹,海螺 AI 的視頻模型很擅長生成人物的面部細節,包括肌肉動作、表情甚至是情緒,都處理得很到位。
不過我也發現在這個視頻裏,女人的下巴在最後幾秒稍微抖動了那麽一下,不仔細還看不太出來,劉海在低頭的時候也沒有很自然地往下垂,但總體瑕不掩瑜。

這段走廊跑步的視頻更驚豔,跑動的動作自然流暢,人物一緻性從頭保持到尾,雖然隻有短短幾秒,但頭發的甩動、光影變換這些細節該有的也都有了。

還有什麽骷髅怪沙漠大片,這畫面表現力都快趕上好萊塢大片兒了。

反正看了一圈海螺 AI 用戶整出來的這些活兒,我算是明白爲啥 Sora 出來之後,會有人第一時間就拿它倆比較了。
該說不說,海螺 AI 還是有實力的。
相信大夥兒也應該對海螺 AI 的視頻模型,有個底兒了,那咱也不多廢話,直接上手試一試。
開局, Sora 先使出了一招雪天雙子塔。
prompt :吉隆坡,雙子塔下起了大雪,周圍的樹上挂着厚厚的積雪
這畫質真沒得說,很像末日電影裏的開頭。
關于 " 厚厚的積雪 " 理解得也很到位,随着鏡頭的移動,兩邊的樹枝沒有出現一丁點的變形,空中飄落的雪細節拉滿。
就是大片大片的枯樹枝交疊在一起,讓畫面看起來有點雜亂。
而且最大的問題是,後面的 " 雙子塔 " 不是雙子塔。
塔頂部分的形狀看起來更像是廣州的小蠻腰,但連接處又是雙子塔的設計。。。在語言的理解上, Sora 犯了太基礎的錯誤,這是差評君沒想到的。
再把同樣的 prompt 喂給海螺 AI ,看看海螺 AI 是如何應對的。
出色的畫面穩定性,還有對于細節的把控,比如樹葉輕微的晃動,還有樹葉的紋理感,海螺 AI 都完成得非常好。
最重要的是,海螺 AI 對 prompt 的理解更精準, Sora 連吉隆坡的雙子塔長啥樣都不清楚,這點扣大分。
再來看這組視頻, prompt 其實挺抽象的,差評君提取了一些關鍵詞大概是 " 超現實主義風格建築 "" 金屬銀色表面 "" 鮮豔的紅色光澤幾何圖案 "" 柔和的散射光 "" 流暢線條、抛光紋理 "
prompt :A hyperrealistic image of a futuristic building featuring metallic silver surfaces with vivid , glossy red geometric patterns.The structure's sleek lines and polished textures are emphasized under soft , diffused lighting , showcasing a sophisticated and innovative design .
這是 Sora 交上來的答案。
說實話如果沒看過 prompt ,很難理解這到底是一個什麽東西,但一一對照關鍵詞,視頻裏的要素基本貼合,建築結構也确實蠻超現實的。
相比之下,海螺 AI 的生成結果更有建築的樣子,該有的也都有。而且視頻裏,還有基于抛光紋理呈現出來的倒影,把上下對稱的細節基本都照顧到了。
第三局, Sora 上來就是一場海上風暴。
Prompt :a storm is brewing overtop of an overcast ocean.the waves are dark and dramatic (一場暴風雨正在陰雲密布的海洋上空醞釀,海浪黑暗而猛烈 )
如果忽略掉那道閃電從頭到尾都沒動過的話,這段視頻能唬住不少人。
輪到海螺 AI ,雖說少了點暴風雨來臨前的氛圍,但波紋的明暗變化、海面的高低起伏刻畫得很細膩,被掀起來的浪花也更有質感。
前面三組對比, Sora 的視頻都是從 OpenAI 官網搬來的,其實對海螺 AI 來說不算特别公平,咱們再來看看網友們自發的比較。( 這部分視頻是差評君手動搬運的,可能畫質上沒有原版那麽清晰 )
同樣都是文字生成的老太太面部特寫鏡頭( 具體 prompt 網友沒分享 ), Sora 和海螺 Al 在真實的皮膚紋理上都下了功夫,面部也沒有因爲鏡頭的移動而發生變形。
隻不過在同樣的 prompt 下, Sora 表達出來的是一個西方老太太。
而海螺 AI 生成的,更貼合亞洲面孔。
當然 AI 對于人種的理解也沒啥好挑刺的,說實話,這波我覺得能打個平手。
如果非要選一個的話,那我個人還是更喜歡海螺 AI 的表達,生動些。
再來看這組古龍喝茶。
prompt :ancient dragon drinking tea
Sora 和海螺 AI 都不約而同地使用了卡通風格,不同的是, Sora 的龍是拿指尖固定住茶杯,而且 " 喝茶 " 的這個動作太奇怪了,直接把頭往下怼,肉眼可見,頭和茶杯重合的地方變形了。。。
海螺 AI 這邊的龍,完勝。
優雅,端着茶杯的方式跟人似的,你甚至還能看到龍把茶嗦起來的那一條線。
總的看下來,差評君最大的感受就是:Sora 強還是有強的道理,但海螺AI 也給了我不少驚喜。
但咱今天也不是非要較個高下,目的還是想看看 Sora 到底有沒有那麽神,結果一比較,發現咱們其實也沒被甩太遠。畢竟,海螺 AI 的視頻模型才上線不到半年,就已經能媲美 Sora 了。
而且在上周, MiniMax 又上新了圖生視頻模型 I2V-01-Live ,新模型革新了二維插畫的動态呈現方式,讓動畫穩定性和細膩表現力有了大幅增強。
看看這絲滑的效果,人物更加靈動了。
不可否認的是, Sora 的産品形态确實領先一步,視頻工作流的設計思路有值得國産 AI 産品借鑒的空間。
但海螺 AI 的路線,更偏向打好地基再建房,産品功能可以等生成能力穩定了再慢慢搭建。
最重要的是,海螺 AI 咱們國内就能用上,普通用戶也可以免費體驗,這性價比直接拉滿了好吧。

要知道, MiniMax 的海螺 AI 不管是技術力還是産品力,妥妥的國内 AI 産品第一梯隊,現在還能跟 Sora 打得有來有回,已經在海外有了一定分量。
随着多模态技術的越來越深入,差評君覺得趨勢也會更加明顯:即使海外有 Sora 坐鎮,以 MiniMax 爲代表的國内 AI 公司,同樣也能爲國産視頻生成殺出一條生路來。
撰文:西西

