編輯|尚恩
編輯|鄧詠儀
你敢信,AI 可以識别氣味了,準确度甚至已經超過人類!這不是危言聳聽,而是來自真實的研究結果。
最近,來自 Google Research、 Osmo Lab 等多個機構研究團隊人員在 Science 上發文,聲稱 AI 模型可以讓機器擁有比人類具有更好的嗅覺。
來源:Science
論文中,研究人員提出了一種由數據驅動的人類嗅覺高維圖譜(POM),這個圖譜可以逼真地再現由單一分子誘發的氣味感知類别的結構和關系,還能夠預測未知氣味的性質。
研究證明,機器學習模型在理解和描述氣味上,已經達到人類水平。并且,在氣味描述的前瞻性預測上,AI 的準确度也已趕超人類…
對此就有網友驚呼道:
視覺聽覺嗅覺都有了,還差觸覺就是一個真正的人形 AI 了!
來源:Twitter
也有一些網友半信半疑的表示,所以現在 AI 都能像人一樣擁有嗅覺了?
用神經網絡識别氣味
首先,我們需要了解在神經科學中,視覺、聽覺的工作原理是将刺激的物理特性映射到對應的知覺特征上。比如聽覺中,頻率與音調相對應,耳朵聽到聲音的高低音調,大腦也會有對應的聽覺感受。
目前,對于視覺和聽覺,學界已有了完善的圖譜将物理屬性(如頻率和波長)和感知屬性(如音高和顔色)相關聯。
來源:公開網絡
同理,爲了讓機器更好地理解嗅覺,也就需要一個更好的映射圖譜。但目前爲止,化學結構與嗅覺感知之間的映射關系尚不明确。
因此,爲了讓機器理解并感受到嗅覺,研究團隊創建了一個機器學習模型消息傳遞神經網絡(MPNN),一個能将化學結構映射到氣味感知中的圖神經網絡(GNN)。
爲了繪制分子結構如何與分子氣味相對應的映射,研究人員建立了一個約 5000 個分子的參考數據集,每個分子都有多個氣味标簽,比如果味、花香等。
在這個數據集中,數據輸入是分子的形狀,輸出是對哪些氣味詞最能描述其氣味的預測。
然後,基于這個神經網絡,爲了檢驗數據驅動的圖譜(POM)是否靠譜,能像人類一樣識别不同氣味,研究人員選擇通過測量映射在表征真實相對知覺距離。
至于爲什麽要測量這個距離,舉個簡單的例子。
如果兩種花香氣味人類嗅覺感知上很接近,它們的空間距離也會較近。而如果是把花香與肉香放在一起,距離就會很遠,因爲人類嗅覺能明顯地将它們區分開來。通過比較這個知覺距離,就可以檢驗模型是否準确模拟了人類的嗅覺。
實驗結果證明,相比人類用鼻聞,數據驅動的圖譜(POM)能夠更好地用表征相對距離和知覺層次結構來識别氣味。
總結就是,使用圖形網絡模型的 POM 表示出來的氣味關系,和真實世界中的氣味關系非常接近。
而使用标準化學信息的氣味映射,表示出來的氣味關系與真實世界的差得比較遠。
AI 氣味描述能力趕超人類
因爲氣味知覺在不同個體之間存在差異性,爲了和人類對比确定這個模型的有效性,能否擴展到新的氣味上。
研究人員特别請來了 15 位專家組成員,讓他們嗅出 400 種氣味,并事先給了他們 55 個詞來描述每種氣味,要求他們對每一種氣味用 1 到 5 分來打分,來評定這個術語在多大程度上适合于這個氣味。
研究人員按氣味标簽對其性能進行了分類,然後将模型與個人小組成員的表現進行了比較。
結果發現,除了對于麝香這樣的複雜标簽外,模型對小組氣味評級平均值的預測比任何一個小組成員都要好。具體來說,在 53% 的測試分子中,模型的表現都優于小組成員的平均值。
按标簽劃分的結果表明,GNN 模型甚至優于之前在相同數據上訓練的最先進模型(SOTA)。
另外,爲了測試模型在結構 - 氣味距離不連續性方面的穩健性,研究團隊還額外設計了一系列測試。
他們選擇一個已知氣味的分子 A 作爲基準,與一個結構很相似的新分子 B 以及一個結構不同的新分子 C 進行比較。
結果發現,人類通常會判斷 A 與結構不同的 C 氣味更接近,而不是與結構相似的 B 更接近。這說明模型可以判斷出連結構不同但氣味很近的分子,不會被外在結構相似性迷惑,而是像人類一樣根據實際氣味相似度進行預測。
模型可以克服結構 - 氣味關系的不連續性,不會被分子結構的相似性誤導氣味距離。比如,過去人類總會将黴味和麝香混爲一談,而大模型就不會了。
實驗團隊提出方法,不僅可以找到很多結構不同但氣味其實非常相似的分子,還可以預測一個新分子可能會有怎樣的氣味特性,比如這種氣味強不強。而通過模型可以直接計算出分子在 POM 中的坐标,研究人員根據這些坐标編制出了大約 50 萬種潛在的氣味。
這個數量遠遠超出了目前氣味目錄所涵蓋的空間(約 5000 種可購買的、有特征的氣味物質)。而收集這些用于訓練模型的分子樣本,需要訓練有素的人類小組成員,通過嗅覺測試花費大約 70 人一年的時間才能完成。
咱就是說,以前人類總是認爲 AI 無法感知物理世界,這下嗅覺也被攻破了。
不過,雖然研究團隊提出的模型能夠重現氣味感知類别的結構和關系,并超過了化學信息學基線。
然而,整個實驗過程還是有些缺失。比如沒有考慮氣味濃度和新元素的分子,而且在使用映射圖譜時需要注意氣味雜質的影響,并定期重新訓練模型以納入新數據。
目前,通過神經網絡深度學習算法來訓練 AI,在視覺、聽覺等方面都取得了不少進展,比如神經拟态系統在硬件層面上複制生物神經元組織。
比起繁複的視覺與聽覺神經系統,生物的嗅覺系統簡單許,氣味信息僅由少數幾層神經網絡進行分析,沒有過多層級與複雜的神經網絡結構,按理說應該發展很快。
其實早在 2009 年,英國斯科塞斯大學的研究團隊就搭建了一種基于昆蟲的嗅覺的模型,用來識别氣味。但相較計算機視覺技術、自然語言處理技術等,當前的應用範圍還是比較小。
就像一般人對氣體檢測與環境分析的需求不高,傳統的氣味傳感器就已可以滿足日常生活使用。
長按添加「智湧」小助手入群, 備注:公司 + 職務