IT 之家 8 月 31 日消息,谷歌于 8 月 27 日發布博文,宣布旗下 Gemini AI 支持更多類型的文件,通過分析、摘錄、洞察文檔内容,爲用戶提供更優質的 AI 服務。
谷歌表示擁有 Gemini Business、Enterprise、Education 或 Education Premium 許可證的 Google Workspace 用戶,現在可從 Google Drive 或本地設備上傳各種文件到 Gemini(gemini.google.com):
電子表格:Gemini AI 現在可以處理 CSV、XLSX 和 ODS 等格式的電子表格,使用戶能夠分析數字數據、跟蹤趨勢,并從财務模型、銷售報告等生成洞察力。
演示文稿:用戶現在可以上傳 PPTX、PDF 和 KEY 等格式的演示文稿,讓 Gemini AI 可以提取要點、總結内容并識别圖表和圖像等視覺元素。
圖像:Gemini AI 現在可以分析 JPEG、PNG 和 GIF 等格式的圖像,提取文本、識别對象并爲視覺内容提供上下文。
音頻:用戶現在可以上傳 MP3、WAV 和 FLAC 等格式的音頻文件,讓 Gemini AI 能夠轉錄語音、識别發言人,并總結訪談、播客和講座中的要點。
視頻:Gemini AI 現在可以處理 MP4、MOV 和 AVI 等格式的視頻文件,從演示文稿、紀錄片和培訓視頻中提取腳本、識别場景并總結關鍵事件。
IT 之家援引新聞稿,Gemini 可以根據用戶輸入的提示詞,更有針對性地分析用戶上傳文件,總結複雜的主題、識别趨勢和洞察力,以及改進寫作和文檔組織的建議,幫助用戶提高理解、研究和寫作能力。