打開潘多拉魔盒的不是 OpenAI,而是谷歌?
在美國國會舉行的聽證會上,OpenAI 首席執行官 Sam Altman 說,OpenAI 目前還沒有在未來六個月内訓練 GPT-5 的計劃,表明年内這家公司可能都不會推出更強大的 AI 模型。
因此有人認爲,谷歌今年晚些時候推出的 Project Gemini 有望成爲全球迄今爲止最強大的 AI 模型。
與現有模型相比,Gemini 的最大優勢在于其多模态能力。谷歌在近期的一篇博客文章中介紹說:
我們已經開始着手研發 Gemini,這是我們從零打造的下一代模型,具備多模态能力,高效整合工具和 API(應用程序編程接口),并爲實現未來創新(如記憶和計劃)而設計。
盡管 Gemini 目前仍在訓練階段,但它已經展現出先前模型從未有過的多模态能力。一經精細調整和嚴格的安全測試,我們将提供不同大小和功能的 Gemini 模型,就像 PaLM 2 一樣,确保它能夠在各種産品、應用和設備上得到應用,造福每個人。
Gemini 比 GPT 強在哪裏?
Gemini 由谷歌最新組建的 Google DeepMind 團隊開發,最大的亮點就是它的多模态能力。
據悉,Gemini 建立在多模态模型的基礎上,不僅能夠理解和生成文本、代碼,還能夠看懂和生成圖像。相比之下,ChatGPT 隻是一個純文本模型,隻能理解和生成文本。
這意味着 Gemini 可以應用于更廣泛的任務領域。例如,基于 Gemini 創建的 AI 聊天機器人,能夠理解和生成文本和圖像。
類似地,Bing 雖然有一個專門用于圖像創建的鏈接,但在聊天框内生成的内容仍局限于純文本,因此用戶無法要求它生成圖像。
與 ChatGPT 相比,Gemini 還可以爲更多種類的産品和應用提供支持。例如,Gemini 可以用于新的 Google 搜索引擎,或者用于創建一種新型 AI 助手。
ChatGPT 和 Bing 都不具備這些能力。但值得一提的是,GPT 5 或許可以實現這些功能。
另外,憑借記憶和計劃能力,Gemini 可以用于創建一種新型的 AI 應用,這是 ChatGPT 做不到的。
例如,Gemini 可以用于創建一個能記住你的偏好并幫助你規劃日常活動的 AI 個人助手。
但據華爾街見聞此前文章,ChatGPT 本周推出的 70 款插件,基本上能夠扮演 24 小時私人助理的角色,但并不能實現規劃這一功能。
AI" 高風險功能 " 将被谷歌開啓 ?
Gemini 的能力令外界感到驚訝,同時也感到害怕。
一名昵稱爲 "AI Explained" 的 Youtube 知名科技博主認爲,谷歌不顧安全風險,賦予模型自行制定并執行計劃的能力,并加速開發這一危險的技術,或加劇 AI 對人類社會的威脅。
AI Explained 發現," 計劃 " 這一能力被谷歌當做 Gemini 的賣點,但被 OpenAI 視爲一種安全風險。
在 GPT 4 的技術報告中,有這樣一段話:
在更強大的模型中,往往會出現新的引人注目的能力。其中一些能力尤爲令人擔憂,包括制定和執行長期計劃的能力,謀求權力和資源的能力(" 謀求權力 "),以及展示越來越 " 主動性 " 的行爲。
谷歌談到将加速對 Gemini 的開發,毫無疑問,其剛剛發布的通用大語言模型 PaLM 2 将是開發加速的地方。可以理解,在這場激烈的全球 AI 競賽中,暫時處于下風的谷歌必須加快腳步。
作爲對比,GPT 4 的技術報告是這樣描述的:
OpenAI 特别關注的一個重要問題是,競争可能引發安全标準下降、不良規範的傳播以及人工智能時間表的加速,進而加劇與人工智能相關的社會風險。我們在此将其稱爲 " 加速風險 "。
也就是說,OpenAI 是不主張在未能确保安全的情況下加速研究 AI 技術的,主動 " 暫停 "GPT5 的開發符合這一理念。