IT 之家 3 月 24 日消息,據《麻省理工科技評論》報道,當地時間周五(22)日發表的一篇論文顯示,蘋果公司的研究人員正在探索利用人工智能來檢測用戶何時在與 iPhone 等設備交談的可能性,從而消除像 "Siri" 這樣的觸發短語的技術需求。
在這項上傳到 Arxiv 且未經同行評審的研究中,研究人員使用智能手機捕獲的語音以及來自背景噪音的聲學數據,訓練了一個大型語言模型,以尋找 " 可能表明用戶需要設備輔助 " 的模式。
論文中稱,該模型部分基于 OpenAI 的 GPT-2 構建,因爲它相對輕量級,可以在智能手機等設備上運行。論文還描述了用于訓練模型的超過 129 小時的數據、額外的文本數據,但沒有說明訓練集的錄音來源。據領英個人資料,七位作者中有六位列出他們的隸屬關系爲蘋果公司,其中三人在蘋果 Siri 團隊工作。
論文最終得出的結論 " 令人鼓舞 ",聲稱該模型能夠比純音頻或純文本模型做出更準确的預測,并且随着模型規模的擴大而進一步改進。
IT 之家提醒:目前,Siri 的功能是通過保留少量音頻來實現的,聽到 " 嘿,Siri" 等觸發短語之前,不會開始錄制或準備回答用戶提示。
斯坦福人類中心人工智能研究所的隐私和數據政策研究員詹・金表示,取消 " 嘿,Siri" 提示可能會增加對設備 " 始終監聽 " 的擔憂。
參考