谷歌の" 反擊 " 來了!
Gemini 被 Sora 搶走的風頭,現在有搶回來的勢頭了。
在最新實測中,Gemini 1.5 能分析 Sora 視頻是否 AI 生成。
是直接給出當中關鍵因素的那種。
比如這個經典的貓貓視頻,Gemini 1.5 直言:
它的眼睛和毛都看起來都不像是真的。
還有像這段生成視頻,Gemini 1.5 都能說出個一二三造假細節來 ~
都說魔法打敗魔法,結果 Sora 發布這才沒幾天,就火速被 Gemini 1.5" 抓出現行 "。
對于 Gemini 1.5 第一波實測結果,網友直呼:that ’ s scary good,并稱其爲 " 遊戲規則的改變者 "。
Gemini 1.5 第一波實測來了
Gemini 1.5 版本突然發布,結果被對面 Sora 的光芒所掩蓋。
但即便如此,其模型性能的重大升級,尤其是支持 100 萬 token 上下文窗口,仍讓網友們印象深刻。
現在一些博主陸陸續續地拿到了訪問資格,開始了第一波實測。
除了能鑒别生成視頻真假之外,還有這些令人印象深刻的功能。
1、分解并理解長視頻。
比如一場 14 分鍾的 NBA 扣籃視頻,Gemini 1.5 能判斷出哪個扣籃得分最高, 并給出其中扣籃細節。
整個響應過程大緻隻需要 55 秒左右。
2、理解長文本内容,進行比較分析。
博主投喂了《星際穿越》和《星際探索》兩個完整的電影腳本,合起來接近 10 萬 tokens,要求 Gemini 1.5 分析比較,以幫助決定觀看哪部電影爲好。
結果隻需三十幾秒,就給出了完整詳盡的分析報告。
這樣一看,分析其中的劇情台詞也就顯得小兒科了。
(分析電影中最鼓舞人心的三句話)
3、翻譯小語種。
即便是那種隻有 2000 人左右使用的語言也能搞定,比如将英語翻譯成薩特蘭語。
除此之外,還有像分析理解論文中表格的細節。
對于這波實測,網友們都表示驚歎:這是個巨大進步,想說可能得等 GPT-5 來對抗。
尤其是能處理 100 萬 Tokens 上下文,這對 GenAI 初創公司很有用。
還有網友好奇谷歌是怎麽解決上下文窗口大小問題的?
一定是發現或實現了什麽新東西。
網友:不太可能是巧合
不過對于谷歌這波 " 反擊 ",暫且還未有 OpenAI 的人出來回應。而此前 Sora 的發布,也少見有谷歌的人出來評價。
但兩家同一天發布,早就有網友浮想聯翩:
确實不太可能是巧合。
奧特曼不想失去谷歌這樣一個絕妙的炒作時機。
有網友認爲,Sora 宣布顯然是一種營銷舉措,它還沒有準備好。相比而言,Gemini 1.5 才是真正的突破。
但也有人認爲,Sora 才真正意想不到。
Gemini 1.5 非常棒,但并不令人驚訝。
我非常有信心 OpenAI 内部也有超過 100 萬個模型。(Sora 是一個副項目)。
并且認爲 GPT-5 出來之後,會擊敗所有的競争對手。
對于兩家這樣的操作,你怎麽看呢?
One More Thing
兩家激戰,受傷的是 Adobe 這類聚光燈之外的玩家。
這兩天股價簡直是一跌再跌……
而此前備受關注的視頻生成公司 Runway,其聯合創始人回應:遊戲開始了。
值得一提的是,此次國内反應跟 ChatGPT 那時候有點不一樣。
Sora 出來之後,少見喊對标的人,比當時要安靜多了…
參考鏈接:
https://twitter.com/rowancheung/status/1759280384930459941