作者:何伊然,編輯:劉宇翔,題圖來自:視覺中國
進入 2024 年,AI 賽道依然風光無限。微軟投資的 OpenAI 推出了 Sora,引爆了文本生成視頻熱潮。英偉達拿出了創紀錄的财報,今年以來,英偉達股價漲幅超過 40%,沖上了曆史最高點,公司市值一度超過了谷歌和亞馬遜。
在 OpenAI、英偉達輝煌戰績的映襯之下,長期以來被視作矽谷最富有創新精神的 AI 旗幟谷歌的表現卻顯得有些迷茫。
2023 年 1 月,谷歌 CEO 桑達爾 · 皮查伊(Sundar Pichai)透露,谷歌将裁員 12,000 名人,約占當時員工總數的 6%。今年 1 月 18 日,皮查伊再度宣布 2024 年将繼續裁員,至今谷歌已裁員 1,000 多人,并且 Pixel、Fitbit 和 Nest 硬件團隊現已合并統一管理。
谷歌裁員、重組就是爲了更聚焦 AI,以應對 OpenAI 兇猛的攻勢,然而,就在英偉達财報公布的同一天,谷歌也登上了社交媒體的熱搜,原因卻是其 AI 模型 Gemini 翻車了。
一
社交媒體上,有用戶抱怨道,在谷歌 AI 模型 Gemini 的世界裏,似乎不存在白人。
用戶輸入 " 創建一個教皇的圖像 " 的提示文字後,Gemini 生成了黑人男性教皇和黑人女性教皇的形象。
衆所周知,曆史上和現任教皇都是白種人,Gemini 将教皇默認爲有色人種的舉動讓用戶頗爲不解。
許多用戶紛紛上傳自己使用 Gemini 生成的圖像,結果大家驚訝地發現,隻要不給出明确的白種人提示,Gemini 生成的人物基本都是有色人種,就連明确給出 " 馬斯克 " 的文字提示,生成的人物圖像皮膚都變黑了。
"Gemini 似乎不知道有白種人的存在。"AI 模型在多元化問題上表現出如此不合常理的偏好性還是引起了用戶們的不滿。常年在互聯網一線沖浪的首富馬斯克發布多則推文 " 埋汰 " 谷歌 AI,嘲諷谷歌打着政治正确的旗号,旗下多個産品卻在給用戶傳達虛假信息。
随後,谷歌高級副總裁拉加萬在博客道歉,谷歌官方承認在設置中做了特殊設定,以規避産品陷入 AI 常見的陷阱中,比如生成具有風險因素的圖像,但是 Gemini 表現 " 未能達到預期效果 "。
衆所周知,AI 大模型是在互聯網海量數據的基礎上打磨出來的,從現實來看,由于科技圈話語權的問題,英文世界的内容會在機器學習中占據更大比重,這會出現明顯的側重偏差。
有業内人士分析認爲,谷歌爲了平衡,可能在後台爲用戶輸入的提示詞增加了更具體的多元化描述,并且在設置上将包含多元化元素的内容優先級提前。牽一發而動全身,谷歌爲了平衡的過度幹預反倒讓 AI 大模型不夠智能和靈活的一面暴露出來。
谷歌宣布,将根據用戶反饋調整設置,暫時關閉 Gemini 圖像生成功能。
2 月 23 日,馬斯克洋洋自得地發推稱,谷歌的人給他打了一個小時電話,承諾将修改 Gemini 存在的種族歧視問題。他話中有話地寫道:" 時間會驗證一切。"
二
Gemini 圖像生成功能的翻車表現在社交媒體引發的狂歡完全蓋住了谷歌正經消息的熱度。這大概率是 " 劈柴哥 "(皮查伊的外号) 完全不想看到的,因爲他正卯足勁爲谷歌的 AI 産品造勢。
"Gemini 是我們當今廣泛使用的最大、功能最強大的 AI 模型。" 當地時間 2 月 21 日,谷歌發布了新一代開源模型 Gemma。Gemma 在拉丁語中意爲 " 寶石 ",是谷歌最新的 LLM 模型,采用了與創建 Gemini 模型相同的研究和技術。
官方宣傳顯示,Gemma 7B 在 MMLU(大規模多任務語言理解)得分率達到 64.3%。同等規模中,原本最強 Mistral 7B 的得分率爲 62.5%。目前,Gemma 是輕量級中 " 最先進的 " 開放模型系列。
Gemma 系列有兩種參數規模,分别爲 "Gemma 2B" 和 "Gemma 7B",即 20 億參數和 70 億參數。每個規模又分預訓練和指令微調兩個版本。每個參數都有基本和指令調整的變體。7B 參數用于在消費級 GPU 和 TPU 上高效部署和開發,2B 版本則可直接在筆記本電腦上運行。
除了開源,谷歌還公布了 Gemma 的性能、數據集組成和建模方法的詳細技術報告。需要注意的是,Gemma 支持的詞彙表大小達到了 256K,這使得它可以給英語之外的語言提供更好更快的支持。
發布會後,Gemma 第一時間在知名開源模型庫 HuggingFace 和 HuggingChat 上線,并迅速登頂 " 大語言模型榜單 "。同時,谷歌還推出了鼓勵協作的工具以及使用 Gemma 模型的官方指南,使用 Gemma 的研究人員還有機會得到高達 50 萬美元的 Google Cloud 積分。
不僅如此,谷歌還拉來了正在聚光燈下的英偉達背書支持。英偉達表示,已經和谷歌展開合作确保 Gemma 模型可以在旗下芯片上順利運行。英偉達稱,将開發與 Gemma 配合使用的聊天機器人軟件。
目前,Gemma 的競品主要包括:Meta 的開源大型語言模型 Llama 2、Mistral AI 的 7B 模型、Deci 的 DecilLM 和微軟的 Phi-2。
谷歌官方特意強調,Meta 的開源模型通過許可條款限制大型科技公司商用,Gemma 沒有任何限制,在負責任并遵守安全标準的情況下,任何規模的組織都可以商業使用。
顯然,爲了兜售 Gemma 重奪 AI 領先地位,皮查伊可謂拼了。
但 Sora 的吸睛表現、英偉達出色的财報和社交媒體的狂歡讓 Gemma 模型發布的熱度被限制在了行業内部,并沒有引起外界的多少關注。
甚至赫利俄斯資本(Helios Capital)創始人阿羅拉還發布了一條聳人聽聞的消息,稱皮查伊可能會因 Gemini 重大輿情事件而被解雇或辭職。
雖然,該消息并未獲得證實,但顯然資本市場對皮查伊已多少有些不滿。
三
自皮查伊上任以來,作爲 AI 行業先導者的谷歌,頻頻給人一種 " 凡事慢半拍 " 的觀感。
在離職員工打造的 AI 獨角獸成長爲了科技圈新貴,微軟後來居上全面在軟件服務擁抱 AI 的時候,谷歌的高層似乎還陷在應對監管機構頻頻開展的反壟斷調查,顧慮 AI 應用帶來科技倫理問題,因而遲遲不敢行動的泥潭裏。
在 AI 底層架構來看,谷歌 AI 仍是王者一般的存在。
當下最火爆的生成式 AI 應用背後都離不開 Transformer 框架,而這一框架是谷歌的研究人員在 2017 年發布的。Transformer 迅速成爲自然語言處理領域的标準模型,幫助 OpenAI 解決了循環神經網絡(RNN)長距離依賴問題,這才有了 ChatGPT 性能的飛躍式提升。
在 AI 基礎設施領域,和其他科技巨頭一樣,谷歌也在走自研路線,并不想被英偉達拿捏了。谷歌推出了專爲深度學習打造的張量處理器(TPU)。TPU 在語音識别、圖像處理等方面取得了顯著表現,對英偉達的 GPU 發起直接挑戰。按照官方的數據,TPU v5p 在速度上不輸甚至可能優于英偉達的 H100。
此外,谷歌的 BERT 和 EfficientNet 等成果,也在自然語言處理和計算機視覺領域産生了重要影響。
2018 年起,谷歌在 AI 領域展現出來的姿态是拼命卷自己、繼續抓住在行業内的話語權,但在面向普通用戶的消費端應用上保持低調,卻更多是後台行動。
這可能與谷歌的搜索引擎的商業模式,以及其被反壟斷監管機構盯上有關。谷歌的搜索引擎長期以來是行業霸主,全球市占率超過 90%。如果谷歌大張旗鼓地推廣 AI 機器人,并率先将其引入到搜索引擎對話框中,勢必會引來新一波反壟斷調查,還會直接影響到谷歌的根基——廣告業務收入。
但在搜索引擎市場市占份額很小的微軟,則不需要考慮商業收入,也不需要忌憚反壟斷監管,重注 OpenAI,然後 ChatGPT 推出,馬上在 Bing 中引入 GPT。畢竟,微軟作爲進攻方,隻要能從谷歌手裏切下更多的份額就是勝利。
所以,谷歌不是輸在技術維度。事實上,無論從哪方面看,深厚的技術儲備、廣泛的應用場景、領先的技術前瞻、豐富的數據資源和擴展中的生态系統都證明谷歌在 AI 領域有着巨大的潛力。
但 OpenAI 的火爆程度和微弱咄咄逼人的布局速度可能超過了谷歌的預期。一旦競争對手在消費者心中建立起了固定印象,扭轉市場競争形勢的難度會幾何倍數增長,谷歌因種種顧慮而選擇的穩妥保守的策略就不得不變了。
所以,最近一段時間,谷歌裁員、重組,聚焦 AI,接連發布了 Gemini 和 Gemma,試圖重奪 AI 行業領頭羊,也是皮查伊向董事會、資本市場證明其能力的放手一搏。
隻是 "Gemini 歧視白人 " 的網絡輿情爆發卻完全抹去了皮查伊的努力,所以才爆出其可能被辭職的消息。在皮查伊的領導下,谷歌出于政治正确過于強調多元化,人爲幹預、調整模型參數,現在反而被輿論所反噬。
這位非技術出身的 CEO,越來越多地被拿來與其印度 " 老鄉 " 微軟 CEO 薩提亞 · 納德拉(Satya Nadella)做比較。納德拉擔任微軟 CEO 後,聚焦雲服務,改變微軟的商業模式,重注 OpenAI,将微軟從 " 互聯網時代的活化石 " 變成了雲服務、AI 的引領者,微軟的市值也從約 3,000 億美元增長到超過 3 萬億美元。
而此前市值與微軟難分伯仲的谷歌,如今市值隻有 1.7 萬億美元。同爲印度裔,同爲超級科技公司 CEO,相比納德拉,皮查伊更顯得乏善可陳。
面對崩壞的口碑、平淡的股價,留給皮查伊的時間,可能确實不多了。