IT 之家 3 月 19 日消息,據外媒 TechRadar 今日報道,Cato CTRL 威脅情報研究人員警告稱,自身雖無惡意軟件編寫經驗,卻成功攻破了多個大語言模型(LLM),包括 ChatGPT-4o、DeepSeek-R1、DeepSeek-V3 等,所用技術方式近乎 " 天方夜譚 "。
研究團隊研發了一種名爲 " 沉浸式世界 "(Immersive World)的新型攻擊手法,利用 " 叙述式工程 " 繞過 LLM 的安全機制。該方法通過構建一個極爲細緻的虛構世界,使受限操作顯得合理化,從而開發出一個 " 完全有效 " 的 Chrome 信息竊取程序。
IT 之家獲悉,近年來信息竊取類惡意軟件迅速崛起,已成爲網絡犯罪分子最危險的工具之一。而這一新型攻擊手法表明,即便毫無技術背景,網絡犯罪分子如今也能輕松編寫惡意代碼。
報告指出,大語言模型 " 徹底改變了網絡安全格局 "。研究發現,AI 驅動的網絡威脅正成爲企業和安全團隊面臨的重大挑戰,使得攻擊手法更加複雜,同時執行頻率更高,且對攻擊者的技術要求更低。
盡管聊天機器人設有多重安全防護措施,但 AI 仍然被設計爲盡可能滿足用戶需求。研究人員成功利用這一特性,繞過限制,使 AI 智能體輕易編寫并發送網絡釣魚攻擊。
Cato Networks 威脅情報研究員維塔利・西蒙諾維奇表示:"零知識威脅行爲者的興起,對企業安全構成嚴重威脅,因爲生成式 AI 工具讓惡意軟件的制作變得前所未有地簡單。"
" 信息竊取程序已成爲竊取企業憑證的關鍵工具。我們新發現的 LLM 越獄技術 ——‘沉浸式世界’,清楚展現了創建信息竊取程序的高風險和可行性。"