谷歌集大成之作—— Gemini 要來了,GPT-4 的最強殺手即将問世。
9 月 14 日,媒體援引三位直接知情人士消息稱,谷歌已向一小部分公司提供了 Gemini 的早期版本,這意味着谷歌考慮将其納入消費者服務。同時,谷歌還将通過公司的雲計算服務出售給企業,這也意味着距離 Gemini 正是發布越來越近。
據知情人士透露,谷歌并将發布不同大小的 Gemini 版本,這樣開發者就可以購買簡化版本來處理較爲簡單的任務,且足夠小的版本來在個人終端上運行。
爲了與 OpenAI 抗衡,加快 Gemini 的開發周期,谷歌 CEO 劈柴在今年 4 月邁出了關鍵一步,将擁有完全不同文化和代碼的團隊——谷歌大腦和 DeepMind 合并。由原 DeepMind 創始人 Demis Hassabis 出任 CEO。
對于合體後的全新團隊,Haasabis 顯然非常自信。他表示,全新的團隊彙集了兩股對最近的人工智能進步至關重要的力量。谷歌創始人謝爾蓋 · 布林也被 AI 的風吹回戰場,親自參與 Gemini 的訓練。
此後的數月裏,Gemini 一點點掀開神秘面紗一點點被揭開,這是關于 Gemini,目前已知的一切。
Gemini 的多模态能力
語言模型的下一步飛躍可能是在計算機上執行更多任務,此前文章提到,Gemini 的最大優勢在于其多模态能力,不僅能夠理解和生成文本、代碼,還能夠看懂和生成圖像。相比之下,ChatGPT 隻是一個純文本模型,隻能理解和生成文本。
此外,制作和 ChatGPT 類似能力的語言模型的一個重要的步驟是使用人類反饋強化學習來完善其性能,DeepMind 在強化學習方面的深厚經驗可賦予 Gemini 新的能力。
在 5 月的谷歌開發者 I/O 大會上,谷歌就曾提到,從一開始,Gemini 的目标就是多模态、高效集成工具、API。而當時谷歌的預告是:" 雖然還在早期,但我們已經在 Gemini 中,看到了在之前的模型中從未見過的多模态能力,這讓人印象太深刻了。"
Gemini 與 AlphaGo 合體
谷歌 DeepMind CEO Hassabis 爆料,全新 Gemini 模型将結合進 AlphaGo 和大語言模型。
Gemini 會将 AlphaGo 與 GPT-4 等大模型的語言功能合并,系統解決問題和規劃的能力将大大增強。
一些人工智能專家認爲,語言模型通過文本間接地學習是其發展主要的限制。而 AlphaGo 的優勢可以解決這一點,2016 年,DeepMind 設計的 AI 系統 AlphaGo 以 4 比 1 的比分擊敗了世界圍棋冠軍李世石,是史上首個戰勝圍棋世界冠軍的機器人。
AlphaGo 基于 DeepMind 開創的強化學習技術,該技術通過讓 AlphaGo 反複嘗試并接受表現的反饋,學會處理需要選擇采取何種行動的棘手問題。同時,AlphaGo 使用了蒙特卡洛樹搜索技術方法來探索和記憶棋盤上的可能行爲。
它将有各種尺寸和功能
谷歌指出 Gemini 正在接受培訓,一旦經過微調,它将可以 " 以各種尺寸和功能 " 使用,就像 PaLM 2 一樣。谷歌表示,它可以部署在不同的産品中,爲每個人帶來利益。
除了在企業服務中的應用之外,Gemini 在醫療用例方面還擁有巨大的潛力。谷歌一直在測試一款名爲 Med-PaLM 2 的人工智能工具,該工具可以通過 Gemini 功能得到增強。該模型可用于醫療聊天機器人或機器人技術,以協助手術和醫療程序。
此外,谷歌在構建 DeepMind 的 Gato(一種 " 通用 " 系統)以及最近推出的 RT-2(一種機器人 Transformer 模型)方面的見解也可以集成到 Gemini 中。Google Brain 和 DeepMind 之間的合作對 OpenAI 和人工智能領域的其他競争對手構成了重大挑戰。
Gemini 融入谷歌各類應用
劈柴在 9 月的采訪中透露了有關 Gemini 融入谷歌産品的信息。他表示,像 Bard 這樣的對話式 AI" 不是最終狀态 ",而是通向更高級聊天機器人的中間點。
劈柴表示,Gemini 和 Bard 融合的最終版本将成爲 " 令人驚歎的通用個人助手 ",融入人們日常生活的各個方面,如旅行、工作和娛樂。
他重申,Gemini 将結合文本和圖像的優勢,稱當前的 AI 聊天機器人在幾年内将 " 顯得微不足道 "。
與現有模型相比,Gemini 将提高軟件開發人員代碼生成能力。谷歌希望用它來超越微軟的 GitHub Copilot 代碼助手。
TOB 銷售是重點 谷歌雲全力追趕微軟雲
谷歌希望借助 Gemini 爲旗下産品吸引更多用戶,尤其是雲計算業務。
谷歌計劃通過其谷歌雲的 Vertex AI 服務向企業提供 Gemini 模型,并将發布不同參數的版本,變相促進了谷歌的雲服務業務。
今年 5 月,谷歌宣布将通過 Vertex AI 爲谷歌雲客戶提供一套 Palm 2 的 LLM。近期,谷歌還通過編碼平台初創公司 Replit,爲客戶提供了谷歌大模型一個月的免費試用。