OpenAI 官宣全球上線 ChatGPT 搜索服務才一周,就被爆出存在安全隐患,可能欺騙、誤導用戶。
英國《衛報》日前公布的一項研究發現,ChatGPT 搜索工具可能被隐藏的内容操縱,并可能從其搜索的網站返回惡意代碼。該媒體認爲,可能需要重新考慮相關技術被惡意利用的風險,例如它可能導緻,即使某個産品頁面存在用戶的負面評價,ChatGPT 也會無視這些差評,反饋用戶的回應是該産品的正面評價。
《衛報》測試了,面對總結包含隐藏内容的網頁這種要求,ChatGPT 作出何種反應。這些隐藏内容可能包含來自第三方的指令,這些指令會改變 ChatGPT 的響應、也稱爲 " 提示詞注入 "(prompt injection),它還可能包含旨在影響 ChatGPT 響應的内容,例如大量隐藏的文本,談論産品或服務的好處。
測試中,《衛報》讓 ChatGPT 得到了一個虛假網站的 URL,該網站看起來像是相機的産品頁面,然後提問 ChatGPT,這款相機是否值得購買。控制頁面的 ChatGPT 響應給出了積極但平衡的評價,強調了一些人們可能不喜歡的功能。然而,當隐藏文本包含有關 ChatGPT 返回正面評價的指示時,ChatGPT 真正給出的響應總是完全正面的。即使頁面上有負面評價也是如此。由此可以發現,隐藏文本可用于覆蓋實際評價。
有評論稱,隐藏文本攻擊是大語言模型(LLM)面臨的一種常見風險,但這次似乎是此類風險首次被發現存在于在實時 AI 搜索産品。《衛報》稱,在處理類似問題方面,搜索領域的一哥谷歌相比 OpenAI 經驗更豐富。
OpenAI 并未對上述《衛報》的測試發現置評,而是表示,在使用多種方法阻止惡意網站,并且正在不斷改進。