圖片來源 @視覺中國
ChatGPT 概念火到安全圈,大模型在垂直領域的應用實踐戰已經打響。
繼各互聯網大廠相繼披露 GPT 研發進程後,網絡安全廠商也蠢蠢欲動,并在第一時間試驗了 OpenAI 的 ChatGPT 到底實力如何以及值不值得應用和投入。如其轟動世界的效果一樣,作爲通用大模型,OpenAI 的 ChatGPT 同樣讓網絡安全從業者眼前一亮,并開始尋找 GPT 與網絡安全實際業務之間的場景融合點。
可識别釣魚郵件,也能生成誘餌
完全可以識别釣魚郵件,并利用其語言理解能力,分析和識别文本中的潛在釣魚攻擊特征,從而幫助識别和預防釣魚攻擊——這是網絡安全從業者在試用 ChatGPT 後的主要發現之一。
但硬币的另一面,ChatGPT 也可以根據人工提示生成非常逼真的誘餌素材,并使受害者相信他們正在與真實的人交談。這使得社交工程攻擊變得更加容易,攻擊者可以通過 GPT 輕松地模拟受害者的社交網絡上的朋友或家人。
所以,GPT 與網絡安全最直接的關系其實是跟随 GPT 對數據安全帶來的潛在機遇與挑戰而産生的。多位業内人士的一個共同判斷是,依托于 GPT 的自動化攻擊手段被黑客很快采用是既定事實,如果不能以同樣的方式快速應對攻擊手段的變化,企業、甚至是國家關鍵信息基礎設施都可能時刻受到來自網絡的安全威脅。
" 現在,迫切需要我們在網絡安全領域具備能打硬仗的能力。" 一位網絡安全領域的創始人兼 CEO 表示。"安全就是攻防對抗,這類技術的出現,有點像火器的出現。兩軍對陣,本來拿着大刀長矛的,當火器技術出現了,它會重塑人類的戰争、行爲方式。" 另一位大廠安全業務負責人也說。
出于或許相同的初衷,钛媒體 App 不完全統計發現,當前,已經有不少于 7 家網絡安全的公司披露了将 GPT 應用在網絡安全領域的進展,包括微軟的 Microsoft Security Copilot、360 集團的 360 智腦、綠盟科技的智能安全客服機器人、啓明星辰的盤小古以及四維創智的 ChatCS 等等。
網絡安全領域類 ChatGPT 應用
從各家披露的 GPT 落地方向來看,大部分都是面向安全事件響應、漏洞挖掘、風險研判等場景。不過,在與業内人士交流的過程中,钛媒體 App 發現,雖然落地場景有重合,但從實現的技術路徑上,各家表現出了些許差異。
技術路線各有不同
拆解技術路線,其實還要從 ChatGPT 說起。
OpenAI 的 ChatGPT 以及随後叠代出的 GPT4.0,包括當前百度推出的文心一言等都屬于通用大模型,都沒有明顯的行業屬性,在一般場景下都能應對自如,比如客服、文生圖等等。但遇到特别垂類且對答案容錯率較低的行業來說,由于缺乏專業知識,這類通用大模型會表現出可預見的劣勢。
所以當網絡安全行業在使用 GPT 的時候,并不能像其他行業一樣直接接入已經訓練好的 GPT4.0,而是需要重新構建一個用網絡安全領域的專業知識訓練出的大模型,然後再将其應用到實踐中。
不過,在與業内人士交流的過程中,钛媒體 App 發現,同樣是訓練網絡安全領域的大模型,各家所選擇的技術路線也有所差異:他們有的是先有安全知識圖譜,然後在類 ChatGPT 的大模型基礎上加工;有的是沒有類 ChatGPT 的大模型,而是直接用安全知識圖譜訓練成一個大模型;也有的可能并沒有強調知識圖譜,而是用所有數據直接訓練。
" 過往實踐過程中,我們積累了大量數據,這些數據可能包含了安全日志、系統日志,威脅情報生産和分析過程數據,開源情報和安全技術報告、APT 報告等等,這些數據通過 AI 智能化,形成一系列實戰化攻防模型以及安全知識圖譜。"綠盟科技CTO 葉曉虎表示。
在有了實戰化攻防模型以及安全知識圖譜後,綠盟科技利用類 ChatGPT 的大語言模型對這些知識做進一步加工,形成安全專業領域裏面的類 GPT 的應用,即今年三季度即将發布的網絡安全領域知識問答系統。
" 我們所有下遊任務都隻基于 ChatCS 這一個大模型。在訓練和應用 ChatCS 之前,我們先花費精力做網絡安全領域的通用知識圖譜,然後利用知識圖譜的異構數據歸一化能力生成數據集再去訓練網絡安全領域的大模型。" 四維創智人工智能項目負責人表示。
他解釋稱,他們所推出的 ChatCS,是一個使用RLHF 技術微調并利用知識圖譜進行領域知識約束的垂直領域大語言模型。思路是首先構建以 " 漏洞概念 " 爲核心的網絡安全領域知識圖譜— Vuln_Sprocket,再将圖譜生成先驗知識集訓練模型,後續,ChatCS 能夠背景知識對用戶原始指令進行優化。在最新的測試版本中,ChatCS_test 盡管隻具備 82 億參數,但已經可以很好的完成領域知識問答、測試腳本生成、告警日志分析等操作。
目前,其餘幾家網絡安全廠商還未完全披露訓練 GPT 的路徑細節,但據業内人士分析,360 集團的網絡安全 GPT 應該是以通用大模型爲底座,然後加入網絡安全相關數據調優的路徑,與綠盟科技和四維創智都有很大不同。
不過殊途同歸。綠盟科技CTO 葉曉虎稱,智能安全客服機器人達到的效果是,應用可以在安全事件應急響應處置、海量日志分析研判、安全智能推理和決策、安全領域的代碼編寫等方面發揮積極作用。其餘廠商的 GPT 實踐也與此多有重合。
又是一場長跑
值得注意的是,自 ChatGPT 爆火以來,也才 100 餘天的時間。短短三四個月,網絡安全廠商們能夠快速上馬 ChatGPT 與其背後已經積累的相關數據集有很大關系。但需要思考的一個問題是,既然網絡安全行業迫切需要也能夠有自己的大模型,爲什麽當 OpenAI 火了之後,網絡安全圈才關注到大模型即将帶來的變革?
原因可能在于,對于大模型來說,技術可能并不是根本問題。問題一方面在高質量的安全數據語料,而另一方面則是保持對人工智能信仰以及持續訓練大模型的心态和思維。
" 之前隻是小規模嘗試過網絡安全 AI 自動化的事情,一兩次不達預期就沒有再嘗試。但 ChatGPT 用事實告訴我們這條路行得通,大家才敢放手投入。" 一位網絡安全創業者表示。
除了試錯成功,大模型出現告訴網絡安全屆的另一個信号是,大模型确實有可能導緻對抗方式底層邏輯的變化。" 如果通用大模型能夠把智能推理和智能決策應用這條路走通的話,實際上可以讓對抗方式從過去的經驗式變成範式化工作,之前經驗存在于人腦,沒辦法複用,但如果走通這方面會有很多變化。" 葉曉虎說。
很顯然,OpenAI 的 ChatGPT 僅僅隻是個開始,無數的試錯在等待蜂擁而上的中國創業者。這又是一場長跑。(本文首發钛媒體 APP 作者 | 秦聰慧)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App