IT 之家 7 月 31 日消息,阿裏旗下達摩院日前與大連理工大學合作,推出了一款名爲 HQTrack 的 AI 框架。該框架主要由視頻多目标分割器(VMOS)和掩模優化器 (MR ) 組成,旨在 " 實現對視頻中任何目标的高質量跟蹤 "。
研究團隊表示,HQTrack 基于開源框架 DeAOT、HQ-SAM,在此之上進行了一定改進,實現了 " 在視頻中分割各目标 " 的可能性。
▲ 圖源 HQTrack 的 GitHub 頁面
同時,研究團隊使用 Intern-T 作爲特征提取器,提高框架對不同類型物體的區分能力,同時加入了一個門控傳播模塊(GPM),以便于框架在複雜環境中感知更多微小物體,生成高質量的即時目标遮罩。
據悉,在 VOTS2023 競賽中,HQTrack 以 0.615 的質量得分獲得第二名,研究團隊表示,該 AI 框架可以應用于人臉識别、智能駕駛、監控追蹤等領域,并有望在未來商業應用中落地。
▲ 圖源 HQTrack 的 GitHub 頁面
該項目目前已經在 GitHub 中開放,感興趣的小夥伴們可以在此訪問,IT 之家将 HQTrack 核心功能轉錄于下方:
1. 多目标追蹤:HQTrack 可以同時追蹤多個目标對象,适用于複雜場景下的目标追蹤任務。
2. 目标分割:HQTrack 能夠準确地分割視頻中的目标對象,并生成高質量的目标遮罩,可用于目标識别和分析。
3. 高質量輸出:HQTrack 的追蹤結果具有高質量和高準确性,能夠滿足各種應用場景的需求。
4. 簡單易用:HQTrack 提供了簡潔的接口和使用指南,用戶可以輕松地使用和集成該工具。