美國康奈爾大學的研究人員最近成功開發了一款聲呐眼鏡,它能夠通過聲學感應和人工智能技術來識别嘴唇和嘴巴的動作,從而連續識别多達 31 個無聲命令。
該系統的成功開發将爲那些暫時不方便說話或無法發聲的人提供非常有用的幫助。比如,那些有語言障礙或喉嚨疾病的人,以及那些在公共場所不方便大聲說話的人。
這款眼鏡是一種名爲 EchoSpeech 的無聲語音識别接口。該眼鏡配備了一對麥克風和比鉛筆橡皮擦還小的揚聲器,成爲一個可穿戴的人工智能驅動的聲呐系統,在面部發送和接收聲波,并感知嘴巴的運動。然後,深度學習算法實時分析這些回聲輪廓,準确率約爲 95%。這款低功耗、可穿戴的眼鏡隻需要幾分鍾的用戶訓練數據,即可識别命令并可在智能手機上運行。
聲呐眼鏡是由可穿戴技術和深度學習算法組成的。它通過穿戴者的嘴部和喉嚨的聲音發射出去的特殊頻率來進行聲學感應,從而識别嘴巴和嘴唇的動作。随着深度學習算法的發展,聲呐眼鏡識别命令的能力也不斷提高,現在已經能夠連續識别多達 31 條無聲的命令。
在測試中,研究人員讓用戶進行一系列的肢體動作和嘴唇動作,聲呐眼鏡可以精确識别這些動作的細微變化,非常可靠地識别命令,并輸出相應的命令觸發器。
這項技術的研究成果将在本月于德國漢堡舉行的計算機協會計算系統人爲因素會議上發表,屆時研究人員将詳細介紹聲呐眼鏡的工作原理和應用前景,以及未來的研究方向。
它的發明将爲那些暫時不方便說話或無法發聲的人帶來更好的生活體驗,讓他們可以更加自如地與世界互動。未來,我們期待該技術能夠更加成熟和普及,爲更多需要的人們帶來幫助。
前瞻經濟學人 APP 資訊組
更多本行業研究分析詳見前瞻産業研究院《2023-2028 年中國眼鏡制造行業發展前景預測與投資戰略規劃分析報告》同時前瞻産業研究院還提供産業大數據、産業研究、政策研究、産業鏈咨詢、産業圖譜、産業規劃、園區規劃、産業招商指南、IPO 募投可研、IPO 業務與技術撰寫、IPO 工作底稿咨詢等解決方案。