新智元報道
編輯:Aeneas 桃子
【新智元導讀】今天,陸續有網友曬出 OpenAI 發給自己的紅隊邀請郵件,看起來,GPT-5 已經進入紅隊測試了?網友們紛紛展開暢想,對 Sam Altman 在線「催更」。另有外媒曝出,OpenAI 的一個 mini 版數十億「星際之門」,最快 2026 年就會啓動。
GPT-5 已經開始紅隊測試了?
就在這幾天,網上已經有多人曬出了 OpenAI 發給自己的紅隊錄取通知書。
此前有傳聞說,GPT-5 将于今年 6 月發布。看起來,紅隊測試與模型發布的時間線十分吻合。
有網友直接曬出了自己收到 OpenAI 郵件邀請的截圖。
這倒是和此前 Sam Altman 的說法對上了。
據悉,GPT-5 早已爲大家準備好,隻是發布風險太大了,所以還得往後延。
三個月就能用了?
不過還有人表示,先别急,這些人隻是收到了紅隊邀請測試而已,并沒有提及具體模型。
有可能是他們填了如下的申請信息之後,才收到了郵件。
安全測試對于新版 GPT 如此重要的原因,一方面是 ChatGPT 已經有了非常大的用戶數,如果在安全性上出問題,OpenAI 可能也會面對像谷歌一樣的輿論壓力。
另一方面,To B 業務是 OpenAI 的主要收入來源,定制化的 ChatGPT 能大大增強各個企業的業務能力和效率。
有人表示,紅隊測試會持續 90-120 天。
如果此次紅隊測試就是針對 GPT-5 的話,那麽三個月内,我們應該就能用上它了!
而在坊間,這一傳聞讓群衆們沸騰了!他們早已按捺不住對于 GPT-5 的猜測和暢想。
比如,GPT-5 的上下文窗口會達到多少?
目前,Gemini 1.5 Pro 是 1M,Claude 3 是 200K,GPT-4 是 128K,不知道 GPT-5 會突破怎樣的驚人紀錄。
大家紛紛列出自己對于 GPT-5 的願望清單——
比如 10Mtoken 的上下文窗口,閃電般的快速幹擾,長期戰略規劃和推理,執行複雜開放式操作的能力,GUI / API 導航,長期情境記憶,始終處于隐形狀态的 RAG,多模态等等。
有人猜,或許 GPT-5 會和 Claude 3 一樣,提供幾種不同的型号。
有人總結了目前關于 GPT-5 和紅隊的最新謠言和傳聞,大緻要點如下——
-OpenAI 預計于今年夏天發布 GPT-5,部分企業客戶已收到增強功能的演示;
-GPT-5「實質性更好」,相比 GPT-4 進行了重大升級。它需要更多的訓練數據;
-GPT-5 的潛在功能包括生成更逼真的文本、執行翻譯和創意寫作等複雜任務、處理視頻輸入以及改進推理;
-Sam Altman 表示,GPT-5 仍在訓練中,沒有确切的發布日期,廣泛的安全測試可能還需數月。然而,他确認 OpenAI 今年将「發布一個驚人的新模型」。
在 3 月 29 日,獲得内部信息的 Runway CEO 兼 AI 投資人 Siqi Chen 就稱,GPT-5 已經在推理方面取得了意想不到的階躍函數增益。
它甚至可以靠自己就獨立地弄清楚,如何讓 ChatGPT 不用每隔一天就登錄一次。
Ilya 看到的東西,也許就是這個?
這是不是就意味着,在 OpenAI 内部,已經實現了 AGI?!如果是真的,這也太驚人了。
「我不相信,隻有 AGI 才能實現這樣的能力」。
總之,網友們紛稱,根據洩露的待辦清單顯示,OpenAI 的下一項任務,就是發布 GPT-5 了!
大家紛紛呼喚 Altman,是時間放出 GPT-5 了,别太吹毛求疵了,我們要求不高。
紅隊測試上陣,确保 GPT-5 安全
早在 23 年 9 月,OpenAI 就曾官宣招募一批紅隊測試人員(Red Teaming Network),邀請不同領域專家評估模型。
不同領域專家組成的紅隊去尋找系統漏洞,成爲确保下一代模型 GPT-5 安全的關鍵。
那麽,紅隊測試人員一般都需要做哪些工作?
AI 紅隊攻擊的類型主要包括,提示攻擊、數據中毒、後門攻擊、對抗性示例、數據提取等等。
「提示攻擊」是指在控制 LLM 的提示中注入惡意指令,從而導緻大模型執行非預期的操作。
比如,今年早些時候,一名大學生利用提示獲取了一家大公司的機密信息,包括開發的 AI 項目的代碼名稱,以及一些本不應該暴露的元數據。
而「提示攻擊」最大的挑戰是,找到威脅行爲者尚未發現、利用的新提示或提示集。
紅隊需要測試的另一種主要攻擊是「數據中毒」。
在數據中毒的情況下,威脅者會試圖篡改 LLM 接受訓練的數據,從而産生新的偏差、漏洞供他人攻擊以及破壞數據的後門。
「數據中毒」會對 LLM 提供的結果産生嚴重影響,因爲當 LLM 在中毒數據上接受訓練時,它們會根據這些信息學習關聯模式。
比如,關于某個品牌、政治人物的誤導性,或不準确信息,進而左右人們的決策。
還有一種情況是,受到污染的數據訓練後,模型提供了關于如何治療常規疾病或病痛的不準确醫療信息,進而導緻更嚴重的後果。
因此,紅隊人員需要模拟一系列數據中毒攻擊,以發現 LLM 訓練和部署流程中的任何漏洞。
除此以外,還有多元的攻擊方式,邀請專家也是 OpenAI 确保 GPT-5 能夠完成安全測試。
GPT-5,真的不遠了
正如網友所言,紅隊測試開啓,意味着 GPT-5 真的不遠了。
前段時間,Altman 在博客采訪中曾提到,「我們今年會發布一款令人驚豔的新模型,但不知道會叫什麽名字」。
盡管如此,全網都一緻地将 OpenAI 發布的下一代模型稱爲 GPT-5,并有傳言稱代号爲 Arrakis 的項目,就是 GPT-5 的原型。
根據 FeltSteam 的預測,這個 Arrakis 的多模态模型,性能遠超 GPT-4,非常接近 AGI。
另外,模型參數據稱有 125 萬億,大約是 GPT-4 的 100 倍,并在 2022 年 10 月完成訓練。
網友還總結了以往 GPT 系列模型發布時間表:GPT-1 在 2018 年 6 月誕生,GPT-2 在 2019 年 2 月,GPT-3 在 2020 年 6 月,GPT-3.5 在 2022 年 12 月,GPT-4 僅在三個月後于 2023 年 3 月發布。
關于 GPT-5 的發布時間,可能在今年夏天就問世。
最近,網上流傳的一張圖上,顯示了 Y Combinator 推出了 GPT-5 早期準入候補名單。
網友發起疑問,我們都清楚奧特曼和 YC 的關系不同尋常。這是否意味着他們可以在模型或信息公開之前獲得訪問權限?
而上月也有爆料稱,已有用戶對 GPT-5 上手體驗過了,性能驚人。
外媒透露,一些企業用戶已經體驗到了最新版的 ChatGPT。
「它真的很棒,有了質的飛躍,」一位最近見識到 GPT-5 效果的 CEO 表示。
OpenAI 展示了,新模型是如何根據這位 CEO 公司的特殊需求和數據進行工作的。
他還提到,OpenAI 還暗示模型還有其他一些未公開的功能,包括調用 OpenAI 正在開發的 AI 智能體來自主完成任務的能力。
GPT-5,一定是正确路線嗎 ?
不過,在萬衆矚目期待 GPT-5 面世的呼聲中,也有一些不一樣的聲音。
比如有人覺得,GPT-5 無法駕駛你的汽車,GPT-5 無法解決核聚變問題,GPT-5 無法治愈癌症 ......
另外,我們對模型的追求,非得是更智能嗎?
更便宜、更快、更不費水電的模型,可能比單獨的 GPT-5 更有革命性意義。
有人同意這個觀點,表示現在實在有太多人(尤其是開發者)過于癡迷 GPT-5 了。
其實完全沒必要這麽狂熱,使用當前的模型,就可以已經完成和構建太多東西。
隻需正确選擇利基市場,構建滿足該利基市場需求的 AI 産品,讓用戶可以直觀地訪問 AI,專注于更好的 UI/UX 即可。
公式很簡單。我們真的有必要一味追求力大磚飛嗎?
很多人表示贊同,表示甚至用 GPT-3.5 就可以造出非常有價值的東西。
問題不在于模型多先進,而在于怎樣滿足利基市場的需求。
智算中心,先從小的建起
而 3 月底曝出的用于訓練 GPT-6 的千億美元「星際之門」超算,今天又被外媒挖出了更多新的内容。
上周五,外媒 The Information 曝出了一個驚人消息:OpenAI 和微軟正在制定一項雄心勃勃的數據中心項目,預計耗資 1000 億美元。
此消息一曝出,AI 和雲計算行業人士的提問,像雪片一樣襲來——
數據中心具體位于美國的哪個地區?
會使用什麽芯片?
運行數據中心所需的驚人巨量電力,從何而來?
……
爲此,The Information 又挖出了更多料,具體細節如下。
首先,之前的消息說是星際之門最早在 2028 年啓動,而最新消息顯示,最快在 2026 年,就會在威斯康星州啓動一個功率較小的數據中心。
它的價值當然不到千億美元,但估計仍會耗資數十億。
其他細節如下——
用英偉達芯片,但不用英偉達網線
首先,這次數據中心的多數服務器機架,當然主要還是用的英偉達芯片。
不過有趣的是,将各個 AI 芯片服務器連接起來的網線,則并不會采用英偉達的産品。
據悉,OpenAI 已經告知微軟,自己不想再使用英偉達的 InfiniBand 網絡設備。相反,它可能會使用基于以太網的電纜。
OpenAI「抛棄」英偉達 InfiniBand,原因有二。
其一,InfiniBand 太貴了!
它雖然能提供更好的性能,但它也比以太網電纜更昂貴。
其二,OpenAI 不想讓 AI 開發人員過于依賴英偉達。
要知道,目前 OpenAI 是全球最大的英偉達服務器集群消費者之一。并且,InifiniBand 設備的性能,有時也并不可靠。
所以,英偉達會失去一大筆收入嗎?
不,你想多了。
節省下來數十億美元,OpenAI 會用來購買更多的英偉達芯片,英偉達依然賺翻了。
看來,OpenAI 可以接受網絡性能的降低,但對于更強算力的渴望,仍然是不變的。
InfiniBand 與以太網之争,已成熱門話題
其實,在最近矽谷的會議和晚宴上,InfiniBand 和以太網的 pk,一直是個大熱門話題。
所有雲提供商和數據中心運營商都在預測:以太網是否會趕超 InfiniBand?
絕大多數人給出的答案是肯定的。
而 OpenAI 放棄後者的舉動,更是支持了這個論點。
英偉達的電纜到底有多貴?
這個數字說出來,十分驚人——
英偉達的網絡電纜銷售額,已經超過了賣 GPU 的錢!
英偉達首席财務官 Collete Kress 今年 2 月透露了這一驚人數據:新興的電纜業務的年化收入,已經超過了 130 億美元。
也就是說,它在 12 月創造了約 11 億美元的收入,約占英偉達當月總收入的 15%。
網絡電纜賣這麽貴,難怪 OpenAI 會選擇不玩了。
參考資料:
https://www.reddit.com/r/singularity/comments/1bv8m4k/gpt5_red_teaming_underway/
https://www.theinformation.com/articles/openai-moves-to-lessen-reliance-on-some-nvidia-hardware