IT 之家 10 月 5 日消息,科技媒體 Windows Report 昨日(10 月 4 日)發布博文,報道稱微軟公司獲得了一項新的專利,構想 Copilot 在未來能輔助用戶創建和視頻、文本、PowerPoint 等匹配的音樂或者背景音樂。
IT 之家注:微軟該專利名爲《Artificial intelligence model for composing audio scores》,主要探讨了基于輸入内容,來創建音樂的方法。
該專利主要概述了以下步驟:
收集數據:收集大量的訓練數據,這些數據包括許多包含視頻和音頻組件的視聽數據集。
分析提取:分析數據集并提取不同類型的特征。例如文本視頻中的顔色、形狀、運動和場景等等。
關聯:Copilot 會分析這些特征并尋找它們之間的相關性。例如,某些場景(如日落)通常伴随着特定類型的音樂(如平靜、舒緩的旋律)。
Copilot 将通過這些特性進行訓練,并利用關聯系統,生成與新視頻的視覺和文本特征相匹配的适當音頻評分。
在現實生活中,這項技術可以用于各種應用,例如:
電影和視頻制作 : 自動爲電影、電視節目或在線視頻生成背景音樂。
廣告 : 創作與商業廣告的氛圍和信息完美契合的音樂。
遊戲 : 制作基于遊戲視覺和動作變化的動态配樂。
虛拟現實 : 通過與視覺環境相适應的音頻增強沉浸式體驗。
其它場景:例如可以在求婚等場景下自動匹配合适的音樂。