IT 之家 2 月 16 日消息,谷歌近日更新博文,宣布開源 Magika,基于人工智能快速高效地識别文件格式和内容類型,相關源代碼已托管到 GitHub 上。
Magika 采用了一個定制的、高度優化的深度學習模型,即使在 CPU 上運行,也能在幾毫秒内精确識别文件類型。
谷歌分享 Magika 的性能數據,100 多種格式的 100 萬個文件基準評估測試結果顯示,Magika 的性能比現有工具高出約 20%,Magika 的精确度和召回率均達到 99% 以上。
在内部,谷歌已經利用 Magika 加強用戶安全。該系統已大規模部署,用于将 Gmail、Drive 和安全浏覽中的文件發送到适當的安全和内容策略掃描器。與以前依賴手工創建規則的系統相比,谷歌通過 Magika 發現文件類型識别的準确率提高了 50%。
谷歌表示 VirusTotal 集成 Magika 之後,進一步提高平台的效率和準确性。在 VirusTotal 的 Code Insight 對文件進行分析之前,Magika 将起到預過濾的作用,Code Insight 使用谷歌的生成式人工智能來檢測惡意代碼。