當地時間 12 月 6 日,谷歌 CEO 桑達爾 · 皮查伊官宣 Gemini 1.0 版正式上線。據悉,這是迄今爲止規模最大,能力最強的谷歌大模型。
桑達爾 · 皮查伊在一篇博文中寫道:" 這個新模型代表了我們作爲一家科技公司所做的最大的科學和工程努力之一,它也是一個多模态基礎模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻。"
據悉,Gemini 1.0 在谷歌内部籌備了一年之久,以應對當時引起巨大轟動的 GPT4。目前,Gemini 1.0 包括三種不同套件,分别是 Gemini Ultra,、Gemini Pro 以及 Gemini Nano,不同量級的 Gemini,可以觸達到不同範圍,能夠高效地運行在數據中心和移動設備等多類型平台上。。
其中,Ultra 的能力最強,複雜度最高,能夠處理最爲困難的多模态任務;Pro 能力稍弱,是一個可擴展至多任務的模型;Nano 則是一款可以在手機端側運行的模型。
谷歌對 Gemini 模型進行了嚴格的測試,并評估了它們在各種任務中的表現,從表現來看,Gemini 被稱爲當下能力最強的大模型。據了解,從自然圖像、音頻和視頻理解,到數學推理等任務,Gemini Ultra 在大型語言模型研發被廣泛使用的 32 個學術基準測試集中,在其中 30 個測試集的性能超過當前 SOTA 結果。
此外,Gemini Ultra 在 MMLU(大規模多任務語言理解數據集)中的得分率高達 90.0%,首次超越了人類專家,更是超過了 GPT4 的 86.4% 的得分率。
在應用規劃方面,谷歌将在其産品中添加 Gemini,進行全線升級。谷歌的類 ChatGPT 應用 Bard 已經升級到了 Gemini Pro 版本,實現了更爲高級的推理、規劃、理解等能力,同時繼續保持免費。而谷歌預計在明年初将推出 Bard Advanced,将使用 Gemini Ultra。
在硬件上,谷歌還将 Gemini 引入了 Pixel。Pixel 8 Pro 将是第一款運行 Gemini Nano 的智能手機。接下來,Gemini 将陸續出現在谷歌其他的産品和服務中。