圖片系 AI 生成
文 | 大模型之家
如何看待 Claude3?" 超越 "" 震撼 "" 吊打 " 已成爲它最深入人心的标簽……
當地時間 3 月 4 日,Anthropic 發布 Claude 3 系列模型,該公司稱這是迄今爲止速度最快、功能最強大的人工智能模型。Claude 3 模型系列包括三個模型,分别是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。
Claude3 的發布一時間引得行業内外群情鼎沸,很多人都将其與 GPT4 進行比較,認爲 Claude3 将是最有可能超越 OpenAI 在人工智能主導地位的大模型。
對此大模型之家也延伸出了一些思考——爲什麽 Claude3 一出場就如此 " 炸裂 "?
GPT-4" 最強勁對手 " 的締造者同樣來自于 OpenAI
就像 360 公司董事長周鴻祎說的 "在矽谷,秘密是保不住的,他們有一個非常強大的人際關系網。"Anthropic 聯合創始人兼首席執行官 Dario Amodei,早在 2016 年便加入了 OpenAI。
作爲 OpenAI 的前副總裁,他本可以與公司一起享受 GPT 帶來的榮耀,但在 2021 年 Amodei 選擇出走 OpenAI 并創立了現在的 Anthropic。
據了解,Dario Amodei 的出走原因,主要與 OpenAI 在 2021 年獲得微軟的投資後的下一步發展路徑這一層面産生了較大分歧。作爲一家非營利組織,Dario Amodei 認爲企業應該堅持自己的願景和計劃,而另一部分高管認爲未來企業将在與微軟的合資企業方面開展營利業務。
并且,彼時的 OpenAI 正面臨着安全問題還未解決的困擾,Dario Amodei 認爲在沒有解決大模型安全問題就上線 GPT-3 将會帶來很多問題,并且這也是一種不負責任的表現。事實上直到 2023 年 ChatGPT 爆火後,OpenAI 現任 CEO 山姆 · 阿爾特曼依然會經常出現在有關人工智能安全問題的聽證會上。
雖然安全問題可能會影響決策,但也隻是推動此類重大變化的考慮因素之一。他也認爲在産品開發與研究重點方面,自己與 OpenAI 不再契合,在種種條件的驅使下 Dario Amodei 選擇創辦一家公司來追求他對人工智能發展的願景。Dario Amodei 的出走更像是一個戰略選擇,目的是在一個新的環境中實施他的人工智能開發哲學,這也是爲什麽他可以帶走 OpenAI 其他具有戰略價值成員,包括 Tom Brown(GPT-3 首席工程師)。
據可查數據顯示,截至 2023 年 7 月,Anthropic 已經籌集了 15 億美元的資金。這包括亞馬遜和谷歌的重大投資,亞馬遜在 2023 年 9 月宣布投資高達 40 億美元。
值得一提的是,2023 年年底 OpenAI 深陷離職風波時,OpenAI 董事會就潛在的合并事宜與 Dario Amodei 接洽,并取代阿爾特曼擔任首席執行官。隻不過Dario Amodei 并沒有接受 OpenAI 的報價,這也從側面說明 Dario Amodei 有着一個企業家或開發者自己的信仰。
與理想背道而馳,Amodei 憋了一股勁
并沒有想着對标誰,Claude3 就是要走一條不一樣的路徑。在調研的過程當中,大模型之家發現 Claude3 在任務處理的過程中通常會給予使用者更精準、更原創的答案。由于 Claude 系列模型對外公布的信息較少,所以業界一直有聲音表示 Claude 的訓練方式源自 Anthropic 提出的 Constitutional AI 概念。
其核心就是通過 RLAIF(Reinforcement Learning from AI Feedback)來對模型進行訓練,通過使用一個強大的現成的語言模型來生成偏好标簽,代替傳統依賴人類反饋的方法。這種方法在文本摘要、有益對話生成和無害對話生成等任務上,已經顯示出與人類反饋訓練相當或更優的性能。
在解決文本理解和生成中的長期依賴性問題下足功夫。Claude 作爲以長文本能力爲優勢的大模型,Claude3 Opus 版本支持了 200K Tokens 的上下文窗口,并且可以處理 100 萬 Tokens 的輸入。
對于許多自然語言處理任務來說,例如機器翻譯、摘要生成、問答系統等,長期依賴性是一個關鍵挑戰,因爲文本的含義通常需要考慮到較遠的上下文聯系。
用戶通常期望大模型能夠理解和生成與其提供的文本相關的廣泛信息。通過訓練模型處理更長的上下文,模型将學習到更廣泛的語言模式,并且能夠更好地适應于不同領域和風格的文本數據。這将增強模型的泛化能力,使其在各種任務和場景下表現更加穩健。
同時,Anthropic 采用了大量複雜的實際問題,以應對當前模型中已知的弱點,并将答案分類爲正确答案、錯誤答案(或虛假答案)以及承認不确定性。
克勞德啓示錄,人工智能離邊界還遠
毫無疑問,Claude 3 的成功,也向全世界釋放着強烈的信号,OpenAI 的地位并不像想象中那樣不可撼動。或許 Claude 的表現并未像官方數據那樣搶眼,但其帶來的影響和産品的商業價值都将成爲創業者最好 " 教科書 "。
特别是對于一些中國的初創團隊,甚至是擁有雄厚資源的科技大廠,Anthropic 團隊的成果證實了想在人工智能領域搶占高地靠的不一定是最頂級的資源,更是要有自身清晰的認知和明确的發展路徑。
有傳言稱 GPT-5 的發布時機,已經不取決于企業本身,更是在迎合目前複雜的國際局勢。無論真實與否,在國際競争中,人工智能都已經成爲新的競争高地,這也爲我國人工智能科研單位、企業帶來了更多動力。
在教育、交通、通信、能源等基建領域、我國人工智能技術發展都在實質性地幫助社會和企業實現降本增效。在兩會政府工作報告中對于新質生産力、人工智能 +、數字經濟、強化企業科技創新主體地位等内容,也引發了在場以及衆多科技從業者的共鳴。
小米董事長雷軍也表示:" 人工智能是現在最熱門的科技創新的話題,最近一系列的技術突破,都是美國最先突破的,我覺得中國在追趕階段,我建議在今天的基礎教育裏面普及人工智能的知識,加大國内的人工智能人才的供給。"
大模型之家認爲加大對人工智能技術研發的投入勢在必行。同時,加強與國際合作,并制定更加明晰的政策和法規,以推動人工智能技術的創新與應用。此外,還需加強人才培養,培養更多的人工智能專業人才,提升國家在人工智能領域的核心競争力。
Anthropic 等故事雖然無法複刻,但人工智能領域的發展還有着更爲廣闊的天地。在我國,實現技術自主才能避免在國際競争中被 " 卡脖子 " 的現象,并且基于各行業廣袤的數據積累,也爲我國人工智能領域帶來先天優勢。在實現技術自主的過程中,可以借鑒國外的先進經驗,同時結合本土實際,積極推動技術自主創新。這不僅可以提高中國在人工智能領域的國際地位,還可以爲中國經濟的高質量發展提供強有力的支撐。