本周（4.15-4.21）AI界發生了什麽？

文｜趙炜嘉

編輯｜鄧詠儀

大佬言論

李彥宏：開源模型将會越來越落後

4 月 16 日，百度創始人、董事長兼首席執行官李彥宏在 Create 2024 百度 AI 開發者大會上表示，未來，自然語言将成爲新的通用編程語言，每個人都可以成爲一名開發者，用自己的創造力改變世界。李彥宏還指出，" 大家以前用開源覺得開源便宜，其實在大模型場景下，開源是最貴的。所以，開源模型會越來越落後。"

紮克伯格：80 億的 Llama 3 還不夠小，大模型需要提升訓練質量

4 月 18 日，Llama 3 正式發布後，紮克伯格在知名主持人 Dwarkesh Patel 的播客中，談及 Meta AI 的技術路線、未來規劃和開源哲學。紮克伯格表示：Llama 3 最小版本的 80 億參數模型 " 還不夠小 "，無法滿足大量使用場景。他更傾向于将模型蒸餾到 5 億、10 億級别，看看能用來做什麽。

李飛飛報告：中國大模型世界第二，但專利數、機器人全球第一

4 月 15 日，由華裔女科學家、" 人工智能教母 " 李飛飛聯合領導的 HAI 研究所（Stanford HAI）近日發布了《2024 年人工智能指數報告》。

報告中指出，2023 年，61 個著名的人工智能模型源自美國的機構，超過歐盟的 21 個和中國的 15 個。然而，中國依然是美國最大的競争對手，中國的機器人安裝量居世界首位；同樣，世界上大多數人工智能專利（61%）都來自中國。

△圖源：HAI

另外，4 月 18 日，李飛飛在拜登的國情咨文演講中呼籲，希望拜登政府出資建設一個國家計算能力和數據集倉庫。她指出，當前 AI 學術界明星人才正大量流失，大公司正在以高薪挖掘學術界人才資源。而研究大模型的高昂成本正在将研究人員排除在該領域之外，從而損害了學術界的獨立研究。

大事件

Meta 開源新一代模型 Llama 3

當地時間 4 月 18 日，Meta 公司宣布最新開源推出新一代大型語言模型 Llama 3，包含 8B 和 70B 兩種參數規模。Llama 3 在由 24000 塊 GPU 組成的定制集群上，使用 15 萬億個 token 訓練的，上下文長度實現 8K，推理編碼大幅提升，代碼和權重全開源。Llama 3 現可在網頁版 Meta AI 免登錄使用。

Stable Diffusion 3 API 發布

4 月 17 日，Stability AI 正式發布 Stable Diffusion 3 API，新的 SD3 在文字位置、提示詞的遵循程度上大幅提升，超過 DALL-E 3 和 Midjourney v6 等行業領先模型。目前 SD3 技術還未完全開源，但 Stability AI 承諾，對于普通用戶，SD3 模型不會收費。

Reka Core 登場，比肩 GPT-4、Claude 3

4 月 16 日，由前 DeepMind、Google Brain 和 FAIR 成員組成的 AI 初創公司 Reka 推出與 GPT-4 匹敵的多模态大模型 Reka Core，具備理解圖像、音頻和視頻的能力，支持 32 種語言，性能可與 GPT-4 和 Claude 3 Opus 匹敵。不過，Reka 沒有計劃開源此模型。

AI 界前線

OpenAI 在東京開設亞洲首個辦事處

4 月 15 日，OpenAI 宣布在日本東京設立亞洲首個辦事處，承諾與政府、當地企業及研究機構合作，開發安全的 AI 工具滿足本地需求。同時，OpenAI 還宣布推出一款專爲日本語言優化的 GPT-4 定制模型，其在翻譯和總結日語文本方面表現出色，性能和速度都有顯著提升，成本效率更高，速度提升至原來的三倍。

波士頓動力推出電動版 Atlas 機器人

當地時間 4 月 17 日，在宣布原液壓版 Atlas 人形機器人退役的一天後，波士頓動力推出全電動版本的 Atlas 機器人。

電動 Atlas 動作的自由度和靈活性遠超人類。它繼承了液壓版的三指設計，采用比其前身更加流線型的設計，有着更靈活的機械骨架，具有類似環形燈的頭部，沒有任何電纜外露。

△圖源：波士頓動力

英特爾推出全球最大神經拟态系統，比人腦快 200 倍

當地時間 4 月 17 日，美國芯片巨頭英特爾（Intel）公司宣布，其已經建立了世界上最大的神經拟态系統 Hala Point，擁有 11.5 億個神經元和 1280 億個突觸，速度最高可達人腦的 200 倍。該系統系統最初部署在桑迪亞國家實驗室，采用英特爾 Loihi 2 處理器，旨在支持未來類腦 AI 的研究。

文心一言 4.0 工具版上新，還發了三大 AI 開發工具

4 月 16 日，在 2024 百度 Create AI 開發者大會上，百度正式宣布基礎模型全面更新，并推出文心一言 4.0 工具版，包括智能體開發工具 AgentBuilder、AI 原生應用開發工具 AppBuilder 和模型定制工具 ModelBuilder，以對應不同的開發場景。

賈佳亞團隊 Mini-Gemini 全開源

香港中文大學終身教授賈佳亞團隊提出多模态模型 Mini-Gemini，提供從 2B 到 34B 的模型大小範圍，融合 ChatGPT+DALL · E 3，具備更高清圖像的精确理解、更高質量的訓練數據、更強的圖像解析推理能力，還能結合圖像推理和生成。目前，Mini-Gemini 從代碼、模型到數據已全部開源，線上 Demo 也已發布。

聯想官宣 5 款 AI PC

4 月 18 日，聯想 TechWorld 2024 在上海開幕。聯想發布了内嵌個性化 AI 智能體 " 聯想小天 " 的 AI PC 系列産品。用戶可基于自然語言與 " 小天 " 交互，" 小天 " 在交互中也能不斷完善。官方演示中，" 小天 " 具備可實現通過自然語言找到照片、AI 跨端生圖等本地化 AI 能力。

融資動态

芯片初創公司 Rivos 融資 2.5 億美元

4 月 17 日消息，RISC-V 芯片初創公司 Rivos 宣布在 A-3 輪融資中籌集了超過 2.5 億美元，該筆資金将專項用于研發其首款針對生成式 AI ( ) 和數據分析工作負載的加速器産品。Matrix Capital 爲本輪最大投資者管理層，英特爾資本、聯發科（MTK）、Cambium Capital、CIDC、Capital TEN 以及 Hotung Venture Group 等投資機構也積極參與了此次融資。

微軟将向阿聯酋 AI 公司 G42 投資 15 億美元

4 月 16 日，微軟表示将向總部位于阿聯酋的人工智能公司 G42 投資 15 億美元，讓這家美國科技巨頭獲得 G42 的少數股權和董事會席位。G42 将在微軟的雲計算平台 Azure 上運行，爲全球公共部門客戶和大型企業提供先進的人工智能解決方案。

新玩意

Rewind 宣布更名 Limitless，推出可穿戴 AI 挂墜

4 月 17 日，Rewind 更名爲 Limitless，推出用于會議場景的可穿戴 AI 挂墜，具備提供實時筆記、會議轉錄和會議摘要等功能，預計将在 8 月發售，售價 99 美元。Limitless 爲用戶配備 " 同意模式 "，以确保隐私保護和加密雲服務确保數據私密性，用戶可控制數據解密。

△圖源：Limitless

前沿研究

Meta 實現無限上下文長度的新算法

Meta 聯合南加州大學、CMU、UCSD 的研究人員近期發布了論文，提出一種名爲 Megalodon 的算法。這是一種新型神經網絡架構，能夠高效處理具有無限上下文長度的文本。Megalodon 引入了多項創新組件，顯著提高了模型的能力、穩定性，以及訓練的性價比，并在多個基準測試中表現出優于 Llama2 的性能。

微軟推出單圖生數字人技術 VASA-1

4 月 18 日，微軟發布 VASA-1 技術，能通過單張圖片和音頻生成逼真的數字人視頻。VASA-1 利用面部動态統一編碼和 Diffusion Transformer 技術，實現精準的唇語同步和自然的表情動作，并支持實時生成。

△圖源：微軟