IT 之家 9 月 29 日消息,随着 OpenAI 的 ChatGPT、微軟的 Bing Chat 和谷歌 Bard 等生成式 AI 服務越來越多地用作搜索引擎的替代品,它們也遇到了一些個人和公司的抵制,這些網站開發者不希望他們的網站數據被用于 AI 模型訓練。
今天,谷歌宣布了一種新方法,網站開發者可以選擇允許其 Bard 和 Vertex AI 服務訪問其内容,或者選擇不用于訓練這些 API 模型。
谷歌在一篇博客中宣布推出 Google-Extended,這是一種新控件,網站開發在可以使用它來管理其網站是否幫助 Bard 和 Vertex AI。
網站目前可以通過 robots.txt 提供拒絕被爬蟲的名單,谷歌認爲所有 AI 模型提供商也都應該提供這種類似的透明度和控制方法。然而,随着 AI 應用的擴展,網站将面臨大規模管理不同用途的日益複雜性。谷歌表示将盡快分享更多信息。
IT 之家從谷歌支持文檔中發現,Google-Extended 沒有單獨的 HTTP 請求 user agent(UA)字符串,抓取是通過現有的 Google UA 字符串完成的;robots.txt user-agent token 可以用于進行控制。
除了今天的聲明之外,谷歌還表示,它将 " 探索其他機器可讀的方法來爲網站進行選擇和控制。" 它包含一個鏈接,這些網站可以在其中注冊郵件列表,在那裏他們将收到有關谷歌改進網站控制的其他更新信息。