出品|虎嗅科技組
作者|餘楊
編輯|苗正卿
頭圖|視覺中國
有沒有發現,降溫後,下班回到樓道,家家戶戶的外賣似乎都香了很多。
這不是錯覺,更不是變饞了。
科學研究表明,一方面,寒冷天氣中,人體需要更多的能量來保持體溫,高熱量食物可以提供這些所需的能量。另一方面,在進化過程中,人類爲了在食物稀缺的季節生存,會自然地增加脂肪儲備以備不時之需。雖說現在有暖氣,沒有天寒地凍的威脅,但深藏在基因裏的本能,還是會驅使人們尋求高熱量食物。
另外,食物與情緒之間存在強鏈接,高熱量食物如甜食可以刺激大腦釋放多巴胺,有助于緩解壓力和提升情緒。畢竟," 晚來天欲雪 " 的天氣,白居易下了班,也要 " 紅泥小火爐,能飲一杯無?"。
随着氣溫持續走低,是選擇 " 貼膘 ",還是繼續做控卡達人呢?
控卡首先是得掐着熱量吃飯。
但沒幾天就會發現,算熱量太累了。于是想到,AI 或許可以一試。拍照讓 AI 估算食物熱量,管理自己的熱量攝入。
iPhone 發布後新上線的一鍵拍照調用 AI 功能也發掘出了這個思路。最近,躍問 app 因爲針對 iPhone16 開發了一鍵調用相機接入 AI 提問的功能而火出了圈。
這一方面釋放出 AI 場景化的控卡垂類用戶信号,另一方面也考驗着 AI 的圖像分析能力。
話不多說,今天我們就來淺淺測評 AI 的食物熱量估算能力,push 一下圖像端側 AI 應用能力生長。
今天參與測評的選手則包括 Kimi、豆包、秘塔 AI 和躍問。
Prompt 爲:假設我中午把這些都吃完了,請問我一共攝入了多少熱量,附件圖片如下。
我們先粗略估算一下參考答案。
圖中是:
一份漏奶華,大約 250g,總熱量約 400kcal;
一份叉燒飯,叉燒約 100g,青菜約 40g,滑蛋約 50g,米飯 150g,總熱量約 600kcal;
一份烤香腸玉米蔬菜拼盤,甜玉米 30g,嫩南瓜 70g,烤腸 120g,總熱量約 400kcal;
一份咖喱魚蛋,共 6 個,約 120g,總熱量約 120kcal;
一杯港式冰奶茶,約 200ml,總熱量約 200kcal。
圖中所有食物熱量約爲 1720kcal。
餓了嗎?記住這份标答。
Kimi
首先是 Kimi,大約 10 秒鍾 Kimi 就交了卷。
首先,Kimi 十分懂中國人的胃,不僅準确識别了食物名,熱量估算也大緻準确。把奶茶識别成了熱巧克力,倒也情有可原。
這直接擡高了我對接下來測評的期待。
豆包
然後是豆包:
豆包的食譜顯然需要豐富一下。漏奶華也許可以約等于松餅,咖喱魚蛋也可以約等于蘸醬了的炸丸子,但是雞蛋蓋飯上的肉直接被無視了,和标答的熱量差額也就出來了。
不過,豆包還貼心的給出了食物的方位。
秘塔 AI
秘塔的回答則是:
這是目前爲止唯一一個識别出烤蔬菜的 AI。
秘塔正确識别了玉米、烤蔬菜、香腸、咖喱魚丸、奶茶。
漏奶華也可以約等于巧克力吐司,但芝士培根飯的芝士顔色,是不是深了點呢?
此外,秘塔的回答簡單明了的同時,也缺失了食物數量的描述,總體來說,我認爲秘塔不善此道。
躍問
最後到躍問:
有意思的是,按照躍問的文本輸出邏輯來推算,其他的 AI 都是從上到下掃描識别食物,但躍問是從左到右掃描識别食物,因此奶茶在第二順位?這個細節所顯示的,可能是底層程序的差異。
另外,從躍問給出的答案來看,它對食物的尺寸和比例沒有概念,從而把漏奶華識别成了提拉米蘇。
同樣,躍問也沒有給出食物的數量,都是一塊、一杯、一份的總量詞描述,對于圖片中的同類項合并能力還尚待觀察。
語言陳述方面,我也建議,可以試着更加 AI 一些,不要 " 我建議你 "。
總結
Kimi 在食物識别和熱量估算方面表現較好,盡管有小錯誤,但總體準确。
豆包對方位更敏感,但需要豐富食譜庫。
秘塔 AI 在識别多樣性上表現不錯,但在食物數量和份量的描述上有所欠缺。
躍問的圖片識别邏輯可能與其他 AI 不同,對圖片所顯示的食物尺寸、比例、數量等變量顯然不夠敏感。
不同 AI 在圖像分析和食物熱量估算方面的能力各有所長,也顯示在實際應用中的潛力和需要改進的短闆。
總的來說,成爲人類的生活助理,AI 們還得加把勁兒。
如果你有觀點、想法或想看的測評,歡迎和我交流。如果你喜歡這期内容,别忘了一鍵三連,因爲這也是我探索更新的動力,我們下期再見~