IT 之家 12 月 31 日消息,日本大阪大學 12 月 23 日發布公報說,該校領導的研究小組開發出一種動态面部表情合成技術,可使人形機器人更好地表達情緒狀态,如興奮或困倦。這項技術有望顯著提升交流型機器人的價值,使它們能夠以更自然、更像人類的方式與人類交換信息,有望解決 " 恐怖谷 " 問題。
IT 之家注:恐怖谷理論是一個關于人類對機器人和非人類物體的感覺的假設,在 1970 年被日本機器人專家森昌弘提出。當機器人與人類的相似程度達到一個特定程度的時候,人類對他們的反應便會突然變得極其負面和反感,哪怕機器人與人類隻有一點點的差别,都會顯得非常顯眼刺目,從而整個機器人有非常僵硬恐怖的感覺。
據公報介紹,雖然人形機器人可以微笑、皺眉或表現出其他各種熟悉的表情,但要在這些表情背後找到一緻的情感狀态卻很困難,令人無法确定它的真正感受,從而讓人産生一種不适感。
傳統上,人形機器人的面部表情采用 " 拼湊法 " 來實現。這種方法需要準備多個預先設定的動作場景,以确保在這些場景之間切換時避免不自然的面部動作。但在實際運用中充滿挑戰,不僅需要提前準備複雜的動作場景,在過渡過程中盡量減少不自然的動作,還要微調動作以精細控制所傳達的表情。
在這項新研究中,大阪大學等機構人員開發出一種借助 " 波形運動 " 的動态面部表情合成技術。該技術将各種構成表情的面部動作表示爲單獨的波,如眨眼、打哈欠等。這些波被傳播到相關的面部區域并疊加起來,從而實時生成複雜的面部表情。該方法不需要提前準備複雜多樣的動作數據,同時避免了不自然的面部動作過渡。
這種技術還可以根據機器人的内部狀态調整個别波形,可以使機器人的内部條件變化即時反映爲面部動作的變化。
研究人員表示,在該技術輔助下,具備複雜面部動作的機器人将能夠展現更生動的表情,并且能夠根據周圍環境變化展現情緒變化,這将極大豐富人與機器人之間的交流。
相關論文已發表在日本《機器人與機電一體化雜志》上,IT 之家附論文鏈接如下: