文|趙炜嘉
編輯|鄧詠儀
大佬言論
李彥宏:開源模型将會越來越落後
4 月 16 日,百度創始人、董事長兼首席執行官李彥宏在 Create 2024 百度 AI 開發者大會上表示,未來,自然語言将成爲新的通用編程語言,每個人都可以成爲一名開發者,用自己的創造力改變世界。李彥宏還指出," 大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以,開源模型會越來越落後。"
紮克伯格:80 億的 Llama 3 還不夠小,大模型需要提升訓練質量
4 月 18 日,Llama 3 正式發布後,紮克伯格在知名主持人 Dwarkesh Patel 的播客中,談及 Meta AI 的技術路線、未來規劃和開源哲學。紮克伯格表示:Llama 3 最小版本的 80 億參數模型 " 還不夠小 ",無法滿足大量使用場景。他更傾向于将模型蒸餾到 5 億、10 億級别,看看能用來做什麽。
李飛飛報告:中國大模型世界第二,但專利數、機器人全球第一
4 月 15 日,由華裔女科學家、" 人工智能教母 " 李飛飛聯合領導的 HAI 研究所(Stanford HAI)近日發布了《2024 年人工智能指數報告》。
報告中指出,2023 年,61 個著名的人工智能模型源自美國的機構,超過歐盟的 21 個和中國的 15 個。 然而,中國依然是美國最大的競争對手,中國的機器人安裝量居世界首位;同樣,世界上大多數人工智能專利(61%)都來自中國。
△圖源:HAI
另外,4 月 18 日,李飛飛在拜登的國情咨文演講中呼籲,希望拜登政府出資建設一個國家計算能力和數據集倉庫。她指出,當前 AI 學術界明星人才正大量流失,大公司正在以高薪挖掘學術界人才資源。而研究大模型的高昂成本正在将研究人員排除在該領域之外,從而損害了學術界的獨立研究。
大事件
Meta 開源新一代模型 Llama 3
當地時間 4 月 18 日,Meta 公司宣布最新開源推出新一代大型語言模型 Llama 3,包含 8B 和 70B 兩種參數規模。Llama 3 在由 24000 塊 GPU 組成的定制集群上,使用 15 萬億個 token 訓練的,上下文長度實現 8K,推理編碼大幅提升,代碼和權重全開源。Llama 3 現可在網頁版 Meta AI 免登錄使用。
Stable Diffusion 3 API 發布
4 月 17 日,Stability AI 正式發布 Stable Diffusion 3 API,新的 SD3 在文字位置、提示詞的遵循程度上大幅提升,超過 DALL-E 3 和 Midjourney v6 等行業領先模型。目前 SD3 技術還未完全開源,但 Stability AI 承諾,對于普通用戶,SD3 模型不會收費。
Reka Core 登場,比肩 GPT-4、Claude 3
4 月 16 日,由前 DeepMind、Google Brain 和 FAIR 成員組成的 AI 初創公司 Reka 推出與 GPT-4 匹敵的多模态大模型 Reka Core,具備理解圖像、音頻和視頻的能力,支持 32 種語言,性能可與 GPT-4 和 Claude 3 Opus 匹敵。不過,Reka 沒有計劃開源此模型。
AI 界前線
OpenAI 在東京開設亞洲首個辦事處
4 月 15 日,OpenAI 宣布在日本東京設立亞洲首個辦事處,承諾與政府、當地企業及研究機構合作,開發安全的 AI 工具滿足本地需求。同時,OpenAI 還宣布推出一款專爲日本語言優化的 GPT-4 定制模型,其在翻譯和總結日語文本方面表現出色,性能和速度都有顯著提升,成本效率更高,速度提升至原來的三倍。
波士頓動力推出電動版 Atlas 機器人
當地時間 4 月 17 日,在宣布原液壓版 Atlas 人形機器人退役的一天後,波士頓動力推出全電動版本的 Atlas 機器人。
電動 Atlas 動作的自由度和靈活性遠超人類。它繼承了液壓版的三指設計,采用比其前身更加流線型的設計,有着更靈活的機械骨架,具有類似環形燈的頭部,沒有任何電纜外露。
△圖源:波士頓動力
英特爾推出全球最大神經拟态系統,比人腦快 200 倍
當地時間 4 月 17 日,美國芯片巨頭英特爾(Intel)公司宣布,其已經建立了世界上最大的神經拟态系統 Hala Point,擁有 11.5 億個神經元和 1280 億個突觸,速度最高可達人腦的 200 倍。該系統系統最初部署在桑迪亞國家實驗室,采用英特爾 Loihi 2 處理器,旨在支持未來類腦 AI 的研究。
文心一言 4.0 工具版上新,還發了三大 AI 開發工具
4 月 16 日,在 2024 百度 Create AI 開發者大會上,百度正式宣布基礎模型全面更新,并推出文心一言 4.0 工具版,包括智能體開發工具 AgentBuilder、AI 原生應用開發工具 AppBuilder 和模型定制工具 ModelBuilder,以對應不同的開發場景。
賈佳亞團隊 Mini-Gemini 全開源
香港中文大學終身教授賈佳亞團隊提出多模态模型 Mini-Gemini,提供從 2B 到 34B 的模型大小範圍,融合 ChatGPT+DALL · E 3,具備更高清圖像的精确理解、更高質量的訓練數據、更強的圖像解析推理能力,還能結合圖像推理和生成。目前,Mini-Gemini 從代碼、模型到數據已全部開源,線上 Demo 也已發布。
聯想官宣 5 款 AI PC
4 月 18 日,聯想 TechWorld 2024 在上海開幕。聯想發布了内嵌個性化 AI 智能體 " 聯想小天 " 的 AI PC 系列産品。用戶可基于自然語言與 " 小天 " 交互," 小天 " 在交互中也能不斷完善。官方演示中," 小天 " 具備可實現通過自然語言找到照片、AI 跨端生圖等本地化 AI 能力。
融資動态
芯片初創公司 Rivos 融資 2.5 億美元
4 月 17 日消息,RISC-V 芯片初創公司 Rivos 宣布在 A-3 輪融資中籌集了超過 2.5 億美元,該筆資金将專項用于研發其首款針對生成式 AI ( ) 和數據分析工作負載的加速器産品。Matrix Capital 爲本輪最大投資者管理層,英特爾資本、聯發科(MTK)、Cambium Capital、CIDC、Capital TEN 以及 Hotung Venture Group 等投資機構也積極參與了此次融資。
微軟将向阿聯酋 AI 公司 G42 投資 15 億美元
4 月 16 日,微軟表示将向總部位于阿聯酋的人工智能公司 G42 投資 15 億美元,讓這家美國科技巨頭獲得 G42 的少數股權和董事會席位。G42 将在微軟的雲計算平台 Azure 上運行,爲全球公共部門客戶和大型企業提供先進的人工智能解決方案。
新玩意
Rewind 宣布更名 Limitless,推出可穿戴 AI 挂墜
4 月 17 日,Rewind 更名爲 Limitless,推出用于會議場景的可穿戴 AI 挂墜,具備提供實時筆記、會議轉錄和會議摘要等功能,預計将在 8 月發售,售價 99 美元。Limitless 爲用戶配備 " 同意模式 ",以确保隐私保護和加密雲服務确保數據私密性,用戶可控制數據解密。
△圖源:Limitless
前沿研究
Meta 實現無限上下文長度的新算法
Meta 聯合南加州大學、CMU、UCSD 的研究人員近期發布了論文,提出一種名爲 Megalodon 的算法。這是一種新型神經網絡架構,能夠高效處理具有無限上下文長度的文本。Megalodon 引入了多項創新組件,顯著提高了模型的能力、穩定性,以及訓練的性價比,并在多個基準測試中表現出優于 Llama2 的性能。
微軟推出單圖生數字人技術 VASA-1
4 月 18 日,微軟發布 VASA-1 技術,能通過單張圖片和音頻生成逼真的數字人視頻。VASA-1 利用面部動态統一編碼和 Diffusion Transformer 技術,實現精準的唇語同步和自然的表情動作,并支持實時生成。
△圖源:微軟