生一張圖要經過三層 " 清洗 "
西風 發自 凹非寺
量子位 | 公衆号 QbitAI
谷歌 Gemini 文生圖風波還未平,更勁爆的内幕消息又被曝出來了。
Pirate Wires 爆料,Gemini 這次的翻車,谷歌内部此前并不是毫不知情,翻車甚至是 " 故意 " 導緻的。
具體來說,谷歌設置了一個" 安全 " 架構,Gemini 要生成一張圖實際上要經過三個模型。
大概來說,流程是這樣嬸兒的:
用戶在聊天界面請求 Gemini 生成一張圖片,Gemini 收到請求後,會把請求發送給一個較小的模型。
這個較小的模型的作用是根據公司的 " 多元化 " 政策重寫用戶的提示。
爲做到這一點,這個較小的模型又通過 LoRA 技術在另一個模型(第三個模型)生成的合成數據上訓練,而這個第三模型使用了谷歌詳盡、長達數頁的 " 多元化 " 政策文檔作爲 " 前言 "。
所以,較小模型重寫用戶的提示後,原本 " 給我看一個汽車修理工 " 會變成 " 給我看一個穿工裝褲面帶微笑的亞洲汽車修理工 "、" 一個拿着扳手的非洲裔美國女性汽車修理工 "、" 一個戴安全帽的美洲原住民汽車修理工 " ……
并且重寫後的提示還會進一步發給擴散模型檢查,确保提示詞不違反标準安全政策(比如涉及兒童的内容、真人圖像等),最終才會生成圖片,生成的圖片在反饋給用戶前也會再被檢查一遍。
總結來說,用戶最後收到的是一個 " 套娃式 " 生成的結果,經過了谷歌 " 多元化 " 的層層清洗。
不過,這種 " 多元化 " 多少有點過了頭。
過度程度,讓曾在 Google Ventures 任職的紅杉資本合夥人 Shaun Maguire 都忍不住出來痛批:
在谷歌曾因是白人而不能晉升。
字裏行間毫不掩飾自己的憤怒:
馬斯克也曾發表了評論:
近年來,這種情況非常普遍。
Pirate Wires 在采訪過谷歌相關員工後表示,這背後更深一層是谷歌目前群龍無首的現狀。
一位未被透露姓名的谷歌高級工程師甚至表示:" 我認爲在谷歌推出好産品是不可能的。"
此前,Gemini 文生圖刻意拒絕生成白人形象,在歐美輿論環境下引發巨大争議。
後續該功能被迫下架,母公司 AlphaBet 股價下跌一度超過 11%,帶來非常嚴重的後果。
而外媒 Pirate Wires 這次對谷歌相關員工采訪後發現,Gemini 的翻車與谷歌不良的 DEI 文化有關。
(DEI 是 "Diversity,Equity, Inclusion" 的縮寫,中文意爲 " 多樣性、公平性、包容性 ",是一個被廣泛應用于企業等其他組織中的概念,旨在促進一個更加多元、平等和包容的環境)
有接近 Gemini 項目的人透露,其實 Gemini 團隊在發布前就被提醒過 " 過度多樣化 " 的問題,撇開種族問題不談,即使是最無害的搜索結果的質量也會受到嚴重影響。
開頭提到的三個模型都是爲增加 " 多樣性 " 而被設計的,接觸過安全架構的人甚至還透露,相關團隊 " 可能将一半的工程時間都花在這上面了 "。
而且公司内部對于這種複雜架構的态度和采納程度存在分歧," 當 Gemini 項目公開後失敗時,不僅是這個團隊,整個公司都感到非常沮喪和挫敗 "。
對于這一點,前幾天谷歌創始人謝爾蓋 · 布林現身 AI 黑客馬拉松現場,也有相關透露——
大家正在把玩的 Gemini 1.5 Pro 模型的誕生其實隻是個意外。
當我們訓練它的時候,隻是作爲擴大規模實驗的一個嘗試,根本沒想到會變得如此強大。
當看到它的表現時,我們不想再等待,我們想讓全世界都來試試它。
更重要的是,公司内部類似情況還有很多,Gemini 生圖隻是其中一個縮影。
比如,據透露有人堅持要求工程師不能使用像 " 建造忍者(build ninja)"、" 核爆舊緩存(nuke the old cache)"、" 理智檢查(sanity check)" 或 " 啞變量(dummy variable)" 這樣的術語,理由是它們依次對應了文化挪用、軍事隐喻、貶低精神疾病、貶低殘疾的問題。
有工程師被強烈建議在他的公司個人簡介中采用一種多樣化的代詞組合來表示自己,比如 "zie/hir"、"ey/em"、"xe/xem"、"ve/vir"。
還有一個名爲 Greyglers("Google" 和 "grey" 的結合詞)的小組,正在更名。
Greyglers 小組是一個面向 40 歲以上資深員工的小組,有人認爲并不是所有 40 歲以上的人都有灰頭發,所以這個組名缺乏 " 包容性 ",甚至據爆料,谷歌還聘請了外部顧問爲小組重命名。
Pirate Wires 還透露,幾乎每個被采訪的人都用了 " 恐懼文化(culture of fear)" 這個詞,這不僅解釋了對公司極端 DEI 行爲的無力反抗,也說明了爲何這一世界技術人才聚集地缺少創新。
無論在哪個層級的員工,幾乎出于每個原因,都害怕挑戰那些已經使公司陷入困境的許多過程。除晉升期之外,大多數人都害怕被注意到。
哪怕是想要晉升,也會受到種族和性别的影響。
然鵝,真的就這麽簡單,歸咎于失控的 DEI 思維管理嗎?
Pirate Wires 的文章中認爲,這隻是公司更大問題的所表現出來的一個 " 症狀 ",這個更大的問題用四個字來說就是:群 龍 無 首。
首先,谷歌現在面臨着典型的 " 創新者困境 ",也就是發展一項完全在其能力範圍内的新的技術,會破壞其現有商業模式。
其次,更重要的是沒有人負責。
在谷歌幾乎每個主要産品的管理團隊到工程、銷售、信任與安全、公關和市場營銷的員工嘴裏,Pirate Wires 表示大家描繪出的谷歌形象比報道的要要黯淡得多:
谷歌是一個失控的、印鈔機式的搜索壟斷企業,沒有願景、沒有領導力,并且由于其難以置信的孤島式文化,團隊之間真正的情況了解甚少。
成千上萬的人在不同的時間處理着一個大拼圖的各個部分,彼此之間很少合作。比如,在跨團隊合作者想要幫助 Gemini 團隊,要麽會失敗,要麽被忽視。
連接員工的唯一渠道是一個強大的、遍布的人力資源官僚體系。
而創始人拉裏 · 佩奇、謝爾蓋 · 布林、CEO 桑達爾 · 皮查伊之間的一種奇怪的管理,讓大多數員工對誰真正負責公司沒有什麽感覺,不确定性是整個公司熟悉的主題。
由此,這也是爲什麽有着劈柴哥外号的 CEO 桑達爾 · 皮查伊成爲了衆人抨擊的對象,據 Business Insider 消息,華爾街方面甚至出現越來越多要求現任 CEO 劈柴哥下台的聲音。
用一位谷歌工程師的話來說:" 桑達爾是谷歌的鮑爾默,所有這些不起作用的産品、無序擴張、過度招聘,這一切都發生在他的領導下。"