字節跳動旗下 AI 助手豆包日前上線了圖片理解功能,在電腦端或 App 端上傳圖片後即可識别圖片内容。
據了解,豆包的 " 圖片理解 " 功能可識别圖片中包含的元素和基本特征。用戶還可通過該功能詢問某景點所處的位置或某個角色出自哪部影視作品。好奇這個功能具體表現如何,那就繼續往下看。
AI 理解圖片
我們嘗試讓豆包識别玻璃瓶可口可樂、一張風景照和兩張影視作品劇照,結果如下:
在 PC 端上傳圖片後,對話框内會自動顯示 " 解釋這張圖片 " 快捷按鈕。可口可樂照片、風景照的解讀令人滿意。
" 牛魔王 " 識别這次結果可用,但并不是期待中的那樣
而在詢問劇照出處時,第一次在 PC 端嘗試,豆包并沒有給出有用答案;第二次在 App 端得到了反饋,但結果錯誤。這張其實是《重啓人生》的劇照。
第一次嘗試第二次嘗試
最後,我們通過豆包拍照功能拍攝了一個機器人手辦,其識别表現尚可。
總結
不斷增加新 AI 能力,對 AI 助理産品來說終歸是好事。此次豆包新加入的圖片解讀能力,總體來說表現中規中矩,有時候會出現沒法給出答案的情況。希望字節跳動繼續優化相關功能,讓未來的 AI 能力變得更可靠。