出品 | 虎嗅科技組
作者 | 王一鵬
頭圖 | Google 官網
就在 2 月 8 日,谷歌 Gemini 又迎來一次重大更新。
首先,2023 年年底承諾的 Gemini 最強版本 Ultra,和 Gemini Advanced 服務正式對外發布;另外,谷歌的生成式 AI 品牌迎來收束:Bard 消失了,隻保留 Gemini ,此前傳聞的 Bard Advanced ,最終證實是 Gemini Advanced。
最後,谷歌生态發力。Gemini Ultra 全方位進入谷歌生态産品,包括安卓端的 Google Assistant、iOS 端的 Google App 、谷歌雲、谷歌文檔、Gmail 等等。
這是迄今爲止,谷歌給予 OpenAI 的最強反擊。
Gemini Ultra,無縫接入生态
目前無論是 Google CEO 皮查伊還是 Google Assistant 和 Bard 副總裁兼總經理蕭茜茜,都沒在 2 月 8 日的官網發布中透露更多技術細節,目前能得知的僅限于皮查伊的部分帶有主觀色彩的描述:
1. 最大的模型 Ultra 1.0 是第一個在 MMLU(大規模多任務語言理解)上優于人類專家的模型,MMLU 使用 57 個科目的組合——包括數學,物理,曆史,法律,醫學和倫理——來測試知識和解決問題的能力。
2. 它可以是個人導師,根據您的學習風格量身定制。或者它可以是一個創意合作夥伴,幫助你規劃内容策略或制定商業計劃。
從去年 12 月的發布來看,Gemini Ultra 的特長是多學科複雜知識的理解和處理上、在 MMLU(大規模多任務語言理解)測試框架中,Gemini Ultra 的得分是 90.0%,在新的 MMMU(專家 AGI 的大規模多學科多模式理解和推理)基準測試中取得了 59.4% 的分數。有消息稱,Gemini Ultra 1.0 動用了五倍于 GPT-4 的算力進行訓練。
GPT-4 與 Gemini Ultra 的性能對比,來自 Google 技術博客
但在 2023 年 12 月 6 日發布時,谷歌表示還在對 Ultra 版本進行微調、強化學習和有對抗的安全檢查,至于這一部分工作進展如何,發布中并未提及。不過 Alphabet 的首席科學家 Jeff Dean 表示 Gemini 1.0 技術報告已經更新,重點在第六節和第七節,主要提及 Gemini 1.0 的 Post-trainning(訓練後微調)以及模型評估、産品評估等内容。(Gemini 1.0 技術報告下載鏈接:gemini_1_report.pdf ( storage.googleapis.com ) )
關于付費計劃,谷歌稱之爲 Gemini Advanced,集成在 Google One AI Premium Plan 權益裏,标價每月 19.99 美元,比 ChatGPT Plus 便宜一美分,贈送兩個月免費試用期和 2T 存儲空間。購買之後,就可以在 Gmail、Google Doc 裏使用 Gemini ——當然,現在還不行,Coming Soon。
此外,谷歌也公布了由 Gemeni Ultra 支持的 Advanced 付費服務,在谷歌生态内的滲透情況,最吸引人的大概是其和 Google Assistant 适配。如果你用的是谷歌的 Pixel 系列手機,那麽通過語音 "hey google" 即可呼出 Gemeni Ultra,既可以爲剛剛拍攝的照片起個标題,也可以圍繞你正在閱讀的文章,提供解讀服務。未來還可以對智能家居進行控制。
iOS 系統上,在谷歌應用裏,也可以實現到 Gemini 的一鍵切換,隻是在整體體驗上,遵循 APP 邏輯,不如 Pixel、安卓原生支持 Gemini 的體驗絲滑。
在辦公工具的協同上,Gemini 1.0 的優勢在于提供基于搜索引擎結果的可靠内容,且會有意在回答中添加一些結構化數據,比如表格,表格同樣可以便捷導入 Google sheets。
巨頭反擊的最好方式:攥緊拳頭
如果說昨天的發布,絕大部分都回應了 2023 年 12 月的預告,在大家的意料之中,那麽 Bard 品牌的消逝,對 Gemini 品牌的全線扶正,則給了人們驚喜,也體現了谷歌的決斷力。
巨型企業,爲了長期保持競争力,通常會采用 " 賽馬機制 ",在内部多線、并行的對某一領域、某一賽道開展進攻,通過内部競争來保持活力。但這也讓人員變得臃腫、注意力變的分散,當真正的挑戰者到來時,巨頭往往不能及時調集全部資源,做出反應。投資界将其稱之爲 " 創業者的機會窗口 "。
2014 年,在收購完成後,Google 幾乎擁有世界最強的兩個 AI 團隊:Google Brain、Google Deepmind,他們創造了 AlphaGo,發明了 Transformer,卻在生成式 AI 時代的早期被擊潰。
Google 的力量太分散了,且缺乏危機感。
在很長一段時間裏,人們很難說清楚 Google 到底有多少個 AI 技術框架和産品:Transformer
、AlphaGo、Bard、Bert、Duplex、Pathways、Imagen、PaLM 1.0/2.0,包括 Meena,後來更名爲 LaMDA。
Google 實際上很早就注意到了 GPT-3 的表現,但受限于複雜的組織架構和分散的資源,并未引起足夠重視。2020 年,Google 基于自己的 Transformer 論文孵化出了 ChatBot :Meena,但據說一直被内部力量阻撓發布、商業化,直到一年後改名 LaMDA 面世。
負責 Meena 項目的兩名研究員 Daniel De Freitas 和 Noam Shazeer,因此拒絕了谷歌的多次挽留,憤而離職,創立了今天爆紅的 character.ai。
痛定思痛的谷歌,第一刀就砍向了組織:2023 年 4 月,Google DeepMind 和 Google Brain 合并,一緻對外。
第二刀發生在昨天:全線收束品牌,全部歸攏在 Gemini 之下。Gemini 其實不是 Google 在生成式 AI 領域的推倒重建,它是過去谷歌技術積累的總和——從前人們會讨論,使用了 Pathways 方法的 PaLM 2.0 表現如何,Imagen 在多模态領域表現如何,但今天,隻看 Gemini 就可以了,它是一個在 Transformer 基礎上創建,融合了 Pathways 方法和 PaLM 成果的全新模型。AlphaGo 的 深度學習能力、Imagen 的多模态能力,都在其中得以彰顯。
此外,OpenAI 的成功,持續給谷歌帶來強大的壓力,也迫使谷歌放棄過于保守的心态。
2 月 9 日有消息稱,OpenAI 的年化收入已超過 20 億美元,據兩名了解該公司财務狀況的人士稱,該公司年運轉率 ( 将前一個月的收入乘以 12 ) 在 2023 年 12 月達到了 20 億美元的裏程碑。消息人士補充說,OpenAI 相信,由于企業客戶對使用 OpenAI 的技術推進生成式人工智能工具在工作場所的運用有濃厚興趣,該公司可以在 2025 年将這一數字增加一倍以上。
在 OpenAI 的刺激下,從 PaLM 2.0 到 Gemini 1.0,谷歌用僅僅幾個月的時間,實現在各種測試機準上的成績大幅提升。谷歌的動作也更加敏捷了,2023 全年與生成式 AI 相關的公司級重大發布、調整動作多達 4 起,爲曆年之最。
此外,谷歌終于發現,相比 OpenAI,自己在生态層面有着巨大優勢——在與 OpenAI 争奪用戶、客戶時,戰場不應局限在 Web 端的 Chatbot,而應該擴展至手機、APP、應用平台、辦公套件、雲服務等多個維度。
到頭來,或許谷歌會發現,原來擊敗 OpenAI 的訣竅并沒有多神秘,自己要做的僅僅是攥緊拳頭,合力一處。