編輯:Aeneas 桃子
經過 23 年的生成式 AI 之年,24 年 AI 會有哪些新突破?大佬預測,即使 GPT-5 發布,LLM 在本質上仍然有限,在 24 年,基本的 AGI 也不足以實現。
23 年是當之無愧的「生成式 AI 之年」。
24 年,AI 技術會有哪些突破?
英偉達高級科學家 Jim Fan 稱,2024 年将是視頻年。盡管機器人和具身智能體才剛剛起步,但我認爲視頻 AI 将在未來 12 個月内迎來突破性進展的時刻。
OpenAI 聯創 Greg Brockman 則預測:2024 年,AI 的能力、安全性、潛在影響的積極性上,都會是突破性的一年。
當然,從更長遠的角度看,這隻是又一個指數級的一年,讓每個人的生活都比今天更好。
新的一年,人工智能還會像 2023 年一樣,大放異彩嗎?
AI 大佬 2024 預測
Meta 的研究員 Martin Signoux 對 2024 年 AI 做出了 8 大預測,就連 LeCun 大佬表示深度贊同。
首先,人工智能智能眼鏡蔚然成風。随着多模态技術的興起,領先的人工智能公司将加倍努力開發人工智能可穿戴設備。還有什麽比眼鏡外形更适合承載人工智能助手呢?
ChatGPT 之于人工智能助手,就像谷歌之于搜索一樣。2023 年,ChatGPT 開始大放異彩,Bard、Claude、Llama、Mistral 和數以千計的衍生産品相繼問世。
随着産品化的繼續推進,ChatGPT 将不再是這個領域的唯一參考标準,其估值也将面臨修正。
大模型模型再見,多模态模型你好。LMM 将不斷湧現,并在多模态評估、多模态安全、多模态這個、多模态那個的争論中取代 LLM。此外,LMM 是邁向真正通用人工智能助手的墊腳石。
沒有重大突破,但各方面都有改進。新模型不會帶來真正的突破(GPT-5 ) ,LLM 在本質上仍然有限,而且容易産生幻覺。我們不會看到任何飛躍,使它們在 2024 年可靠到足以「解決基本的 AGI」。
在 RAG、數據整理、更好的微調、量化等方面的改進,将使 LLM 在許多用例中變得足夠強大 / 有用,從而推動各行業各種服務的采用。
小模型(SLM)已經出現,但成本效益和可持續發展的考慮将加速這一趨勢。量化技術也将大大提高,從而推動消費服務的設備集成浪潮。
開源模型擊敗 GPT-4,開源與封閉之争逐漸平息。回顧過去 12 個月開源社區的活力和進步,很明顯,開源模型将很快縮小性能差距。
基準仍然是一個難題。沒有一套基準、排行榜或評估工具能夠成爲模型評估的一站式服務。相反,我們将看到一系列改進(如 HELM)和新舉措(如 GAIA),尤其是在多模态方面。
與現有風險相比,存在的風險不會引起太多讨論。雖然 X 風險成爲 2023 年的頭條新聞,但公衆讨論将更多地關注與偏見、假新聞、用戶安全、選舉誠信等相關的現有風險和争議。
Lightning AI 的創始人 William Falcon 對 2024 年的預測是:
- 1B 模型性能将優于 70B。
- 在 CPU 上部署模型幾乎是免費的,而不是 API 服務。
- 數據質量将使性能提升 10 倍。
- 開源模型的組合将擊敗最好的私有模型。
- 編譯器将使模型(訓練和推理)的速度至少提高 80%。
- 立法将支持内容創建者,而非模型開發者。
開源工具平台 LlamaIndex 的創始人 Jerry Liu 表示,
- RAG 将繼續成爲一個大焦點
- 每個 AI 工程師仍然需要強大的軟件工程基礎。
- 向量數據庫開始開發類 SQL 接口并支持多模态
- 多模态模型在文檔處理中得到更多使用(但首先,計算成本 / 延遲需要降低)
- 類似 GPT-4 的全部能力成爲開源,并且更快 / 更便宜。
- 如果是這種情況,智能體的開發會重新蓬勃發展。
- 提示和以前一樣重要,但提示工程的重要性會下降
2023 年,ChatGPT 訪問量全球居首
過去一年裏,AI 無處不在,甚至重新定義了整個行業。
在線内容寫作公司 Writerbuddy AI 使用 SEO 行業著名的工具 SEMrush,通過抓取 AI 工具數據,研究了 3000+ 種 AI 工具。
結果發現,從 2022 年 9 月 -2023 年 8 月,排名前 50 的 AI 工具,産生了超過 240 億次的驚人訪問量,平均每月增長 2.363 億次。
其中,ChatGPT 獨占了 140 億流量,占分析流量的 60%。
以下是報告中的關鍵發現:
- AI 行業平均每月增長 2.363 億次訪問量。分析的 50 個人工智能工具經曆了 10.7 倍的增長率,平均每月訪問量增加 2.363 億次。
- 過去 12 個月中,AI 應用每月平均訪問量達到 20 億次。過去 6 個月,每月平均訪問量激增至 33 億次。
- ChatGPT、Character AI 和 Google Bard 的訪問量分别淨增長了 18 億次、4.634 億次和 6800 萬次。
- 訪問量最高 AI 聊天機器人:ChatGPT 處于絕對領先地位,占 AI 聊天機器人類别總訪問量的 76.31%。緊随其後的是 Character AI,以 19.86% 的訪問量位居第二。
- Craiyon、Midjourney 和 Quillbot 面臨最大的流量下降。
- 美國貢獻了 55 億人次訪問量,占總訪問量的 22.62%,而歐洲國家合計貢獻了 39 億人次訪問量。
- AI 聊天機器人工具最受歡迎,訪問量達到 191 億次。
- 超過 63% 的 AI 工具用戶通過移動設備訪問。存在性别差異,69.5% 爲男性用戶,30.5% 爲女性用戶
除了風靡全球的 ChatGPT,23 年的這些技術也很驚豔
23 年過去了,這一年的關鍵詞,無疑就是「生成式 AI」。
22 年底 ChatGPT 的推出,以及 23 年 3 月發布的 GPT-4,讓全世界見識到了大語言模型的廣泛可用性,讓 23 年變成了屬于文本、音頻和視頻生成式 AI 的一年。
除了今年的「寵兒」ChatGPT 之外,其他公司的鋒芒也不應被忽視,比如放出了第一個開源語言模型的公司,和幾家新的 AI 初創公司,包括在年底發布了目前可用的最佳開源語言模型 Mixtral 8x7B 的 Mistral。
除此之外,還有以下這些讓人印象深刻的技術。
斯坦福小鎮和機器貓
「斯坦福小鎮」,展示了令人印象深刻的文本和編碼任務的應用。
團隊創建了一個受模拟人生啓發的沙盒環境,其中的 25 名 AI 智能體,每個都有屬于自己的職業和個性,可以自主互動。
這些智能體表現出了可信的個人和緊急社交行爲,包括做計劃、參加情人節派對。這項工作展示了基于 LLM 的智能體如何相互交互,并産生了有趣的結果。
這一想法已被其他研究和開源項目所采用,例如 Auto-GPT 和 BabyAGI,而 OpenAI 則通過 Assistant API,将其大大簡化。
GPT-4 等基礎模型,也已用于機器人技術,取得了一些進展,比如谷歌的機器人 RT-2 和 RoboCat。
RT-2 是一種用于機器人控制的 AI 模型,可以從機器人和網絡數據中學習。該模型可以處理文本和圖像輸入,并利用其廣泛的網絡知識來執行尚未經過明确訓練的任務。
在 6000 多次機器人測試中,RT-2 在未經訓練的任務中的成功率,幾乎是其前身的兩倍。
另一方面,RoboCat 是一種 AI,可以生成訓練數據,以改善機器人的控制。
其他公司的技術,如英偉達的多模态 VIMA 模型,也在機器人技術中使用了基礎模型。
DreamerV3 和 FunSearch
在強化學習領域,研究者們也取得了不少重要成果。
一個例子是 DreamerV3,它可以處理完全不同的問題,而無需任何調整。
在沒有人類模型的情況下,DreamerV3 就會學習如何在 Minecraft 中開采鑽石。
今年早些時候,DeepMind 還展示了 AdA(Adaptive Agent),這是 DeepMind 的一個基礎強化學習模型。
AdA 遵循基礎模型的經典配方,在具有大量數據的任務上進行了訓練。AdA 之所以意義重大,是因爲它表明了,強化學習中的擴展可以使模型在其他任務上表現更好。
在各個科學領域,深度學習展現出越來越多的作用。
DeepMind 開發了 AlphaTensor,一種用于快速矩陣乘法的新算法。
同時,DeepMind 最新版本的 AlphaFold 蛋白質結構預測系統,克服了之前版本的許多弱點,爲計算結構預測開辟了新的可能性。
此外,Google DeepMind 還展示了 FunSearch,這是首次使用代碼生成語言模型與進化搜索算法相結合,爲數學問題找到以前未知的解決方案。
OthelloGPT、Q-Star 和 AI 法案
2023 年,也是 AI 監管的一年,和對 AI 存在主義風險發出警告的一年。
這種趨勢無疑也會刺激業界研究,好讓人類更好地理解 LLM 的内部工作原理。
這期間有一些有趣的論文,比如 OthelloGPT,微軟的 GPT-4 體現了 AGI 火花,以及谷歌關于大模型「頓悟」的論文。
提示工程領域提供了對 LLM 的見解。
François Chollet 将提示工程解釋爲尋找正确的向量程序和 Promptbreeder,這表明,提示在未來可能會變得更加自動化。
在年末,傳起了關于 Q-Star 的謠言,伴随着人們的 AI 的恐懼、AGI 的炒作、以及短短幾天多次反轉的 OpenAI 宮鬥鬧劇。
在 2024 年,或許我們會看到猜測變少,談判變多。
AI 訓練使用的數據,在哪些範疇内是合理的?最近美國媒體對 OpenAI 發起的訴訟,引起了全社會範圍内的廣泛探讨。
類似的辯論,也将在歐盟上演,在今年年底前,歐盟各國就《歐盟人工智能法案》達成一緻。這一法案的細節将在明年決定,并且對歐洲的人工智能市場産生重大影響。
2024 AI 展望
在經曆了爆炸性的 2023 年之後,2024 年的人工智能領域有将會有哪些進展?
毋庸置疑,在這個新的一年裏,我們仍将看到領先的 AI 在許多新的創造性方式中應用,推動整個行業的進步。
Copilot AI 登台:智能體時代來臨
OpenAI 在首屆開發者大會上發布的 GPTs、Assitants 等工具,微軟産品全線更名 Copilot 等等,智能體在今年迎來了大爆發。
這些工具已經開始在一個又一個行業産生影響,但我們迄今所看到的與即将到來的相比微不足道。
今年早些時候,來自普林斯頓、谷歌團隊發表的 ReAct 論文展示了大模型如何有效地學習如何使用工具,并推動了這方面的大量研究。
OpenAI、Anthropic 在内的公司已經花了一年的時間來調整自家模型,以便更好地使用這種技術。
比如,OpenAI 的函數調用,以及 Anthropic 的 Claude XML 支持。
項目地址:https://react-lm.github.io/
還有一些研究機構專門訓練了專門的大模型,比如伯克利的 Gorilla LLM。
另外,開源代碼庫 Langchain、Rivet 等都讓智能體變得容易得多。
看得見,AI 智能體比以往任何時候都更容易開發,成本也更低。它們在發揮人類聰明才智的同時,還能深入連接對用戶和公司最重要的數據。
2024 年,我們将看到「智能體時代」的到來,這是通過軟件滿足需求和與技術互動的一個全新方向的開端。
多模态大模型突破視覺障礙
ChatGPT 能夠理解和表達人類自然語言,這是吸引用戶和開發者的突破性功能。
但是,2024 年将看到 AI 視覺可能會更加重要,影響更加深遠。
文字固然強大,但圖像、視頻、音頻能以更集中的方式傳遞信息和情感。思想的空間表達是一種非常強大的工具,可以簡單地傳達複雜的概念。
LLM 不僅能對文本數據進行訓練,還能對視覺數據進行訓練,多模态能力更加明顯。
我們已經看到,Ai Pin、Apple Vision 等可穿戴設備的發展,它們有望爲我們的日常生活提供幫助。
例如,它們可以提供與交流的人的背景信息、與工作相關的視覺提示,或完成任務的實時建議。
創新将走向何方?速度有多快?現在還很難說,但能夠解讀圖像和視頻并對環境中的物理變化做出即時反應,爲智能人工智能隻能以如何幫助人類增添了一個極其重要的維度。
AI 操控達到危險級别
AI 爆發爲各個領域帶來翻天,覆地的變化的同時,也讓我們看到 AI 生成虛假信息給生活帶來了困擾。
在人類曆史上,大規模影響和操縱 AI 從未如此強大,也從未如此普及。
人工智能已經讓人們幾乎無法辨别「真實」的社交互動與内容,因爲圖像,甚至視頻都可以很輕而易舉地生成。
未來一年,人工智能操縱可能會大行其道,從自動勒索和欺詐到陰謀論的傳播。
總而言之,2024 年,人工智能将給世界帶來許多令人難以置信的東西,但它也将以新的方式挑戰我們。
知友預測
關于此話題的暢想,也上了知乎熱榜。
知友「引線小白」預測,在 24 年,模型效果會進一步突破,可能隻要 7B 的模型推理資源,就能與現在的 GPT-4 持平。
随着部署成本大幅下降,24 年可能就會成爲 AI Agent 元年,出現一個爆款。
多模态進多模态出一統江湖的模型,有可能出現。
第一部 AI 電影,也有望在 24 年出現。
清華自動化系在讀博士認爲,「多模态大模型取得進一步突破,圖片和視頻生成能力進一步提升。更多的人力工作,特别是需要部分創造力的工作被取代。部分領域大模型的湧現能力進一步凸顯,表現出一些更加具有創造性的行爲。」
AI 架構師「春陽 CYang」預估,2024 年應該是 AI 大模型應用落地的元年。
2023 一整年,雖然大模型火爆,但真正能夠落地的産品還很少,隻集中在改寫文案等淺層的應用上。
但現在,有很多大模型領域的創意産品在落地了,可以期待一波。
程序員 @小五哥預測道——
大語言模型将在手機端運算推理;Agent 将代替人做一些更實用的事情;最令人開心的是,人形機器人很可能幫我們洗衣、拖地、做飯、收拾房間了!