Arm正式IPO，Meta計劃對标GPT-4訓練下一代大模型，Adobe Firefly 生成式 AI 模型全面開放商用

作者：子渝

編輯：沈筱

微軟發布 1.3B 參數量小模型，效果優于 7B 參數 Llama2

9 月 11 日，微軟發布開源模型 phi-1.5，在隻支持代碼的 1.0 版本之上加入了一般場景對話。該模型的參數量隻有 1.3B，但效果已經超過了擁有 7B 參數的 Llama2。phi 團隊一緻認爲，數據的質量遠比數量更重要。所以與一衆卷參數量的模型相比，phi-1.5 不僅參數量不到 Llama2 的五分之一，訓練時所用的 token 更是少了一個數量級，隻用了 3 千億的訓練數據。但 phi-1.5 在 AGIEval、 LM-Eval 等多個 Benchmark 上都取得了比 Llama2 還要優異的成績。

https://www.sohu.com/a/721106310_610300

英偉達 GH200 超級芯片首次亮相 MLPerf v3.1，性能躍升 17%

9 月 11 日，推出不到兩個月的英偉達 GH200 Grace Hopper 超級芯片首次亮相 MLPerf 行業基準測試。在此次測試中，具有更高的内存帶寬和更大的内存容量的 GH200 與 H100 GPU 相比，性能高出 17%。此次 MLPerf Inference v3.1 基準測試是繼 4 月發布 3.0 版本之後的又一次更新，這次更新包含了兩個方面：引入基于 60 億參數大語言模型 GPT-J 的推理基準測試（AI 模型的大小通常根據它有多少參數來衡量）和改進的推薦模型。

https://www.thepaper.cn/newsDetail_forward_24580685

Meta 計劃對标 GPT-4 訓練下一代大模型

9 月 11 日消息，Meta 購入大量英偉達 H100 芯片，并積極擴建數據中心，減少對微軟 Azure 雲平台的依賴，以創建一款更爲強大、複雜的聊天機器人。Meta 将 GPT-4 作爲其下一個 AI 模型的标準，并計劃在 2024 年開始訓練，旨在模仿人類的表情和感情，提供更加逼真的交互體驗。根據此前洩露的消息，Instagram 正在測試一個具有 30 種性格的聊天機器人，可能與公司即将推出的未公布的人工智能 " 角色 " 相關聯。

https://new.qq.com/rain/a/20230911A04IZL00

字節跳動旗下 " 悟空搜索 "App 更名 " 小悟空 "，提供 200+AI 工具

9 月 11 日消息，字節跳動于去年推出 " 悟空搜索 "App，主打 " 無廣告搜索 "。現在，這款 App 宣布更名爲 " 小悟空 "。小悟空 App 内包含基于大語言模型的 AI 工具合集，支持智能對話和輔助推薦功能。智能工具分類包括創作生成、學習提升、工作職場、專業咨詢、虛拟角色、休閑娛樂等，用戶可以使用該工具進行翻譯、法律咨詢、趣味測試等操作。

https://www.ithome.com/0/718/425.htm

研究發現 ChatGPT 可在七分鍾内完成軟件開發，平均成本不足 1 美元

9 月 12 日消息，來自布朗大學和多所中國大學的研究團隊進行了一個實驗，探究是否可以用 ChatGPT 的 3.5 版本的語言模型來驅動的人工智能機器人，在沒有事先訓練的情況下完成軟件開發過程。研究者創建了一個假想的軟件開發公司，名爲 ChatDev。研究表明，這個由人工智能驅動的公司平均可以在不到七分鍾内以不到一美元的成本完成整個軟件開發過程，同時通過其 " 記憶 " 和 " 自我反思 " 的能力識别和解決 " 潛在漏洞 "。

https://www.ithome.com/0/718/638.htm

國内外高校聯合開源強化學習策略，讓機器狗能跑酷

9 月 12 日消息，來自上海期智研究院、斯坦福大學、上海科技大學、卡内基梅隆大學和清華大學的研究者聯合開展了一個項目，旨在通過開源強化學習策略讓機器狗掌握多樣化的通用技能，以迅速應對各種場景和障礙。該項目基于一種新的開源系統，可以學習基于視覺的端到端跑酷策略，無需依賴任何參考動作數據。這種強化學習方法能夠讓機器狗學會攀爬高障礙、跳過大間隙、在低障礙下爬行、擠過狹小縫隙和跑步等技能，并将這些技能整合成一個基于視覺的跑酷策略，可以直接部署到四足機器人上。

https://new.qq.com/rain/a/20230912A04MBX00

用戶反映 llama2.mojo 實現比 llama2.c 快 20% 的效果

9 月 12 日消息，一名 Mojo 社區成員将 Python 程序 llama2.py 移植到 Mojo 上，實現了比原版 llama.c 快 20% 的效果，顯示了 Mojo 在硬件級優化方面的巨大潛力。Mojo 是一種新的面向 AI 開發人員的編程語言，其目标是将 Python 的易用性與系統編程功能結合，實現高性能計算。Mojo 可以無縫集成 Python 代碼和庫，同時提供與 C++ 和 CUDA 相匹配的性能。Mojo 的發明者 Chris Lattner 表示，他創立的公司 Modular 新獲得的 1 億美元融資将用于推動 Mojo 的進一步發展和産品擴展。

https://finance.sina.com.cn/tech/roll/2023-09-12/doc-imzmmpkq5281189.shtml

騰訊健康公布醫療大模型，并發布 AI 醫療産品矩陣

9 月 12 日消息，據騰訊健康官方公衆号報道，騰訊健康在日前公布了旗下醫療大模型，并發布 " 智能問答、家庭醫生助手、數智醫療影像平台等多場景 AI 産品矩陣 "，以及藥物發現平台 " 雲深 "（iDrug）。這一醫療大模型基于騰訊混元大模型，适用于文案生成、智能問答、病曆結構化和檢索、影像報告和輔助診斷等場景，可嵌入醫療環節全流程；同時，在 AI 驅動藥物發現方面，騰訊宣稱，旗下 " 雲深 "（iDrug）平台已同時具備了小分子藥物與大分子藥物的加速發現能力。

https://www.ithome.com/0/718/473.htm

Adobe Firefly 生成式 AI 模型全面開放商用

9 月 13 日消息，Adobe 宣布，經過幾個月的測試，Firefly 生成式 AI 模型已正式上線，可在 Adobe Creative Cloud、Adobe Express 和 Adobe Experience Cloud 等多個應用中使用。此外，Adobe 還推出了一個獨立的 Firefly 網頁應用，讓用戶在不使用特定的 Adobe Creative Suite 應用的情況下，也可以體驗生成式 AI 的功能。

https://www.ithome.com/0/718/969.htm

華人團隊提出 Medusa 簡單框架，可将 LLM 推理速度提高 2 倍

9 月 13 日消息，來自普林斯頓、UIUC 等機構的華人團隊提出一個用于加速大型語言模型（LLM）推理速度的簡單框架 Medusa，并于 9 月 12 日開源發布。Medusa 通過增加多個解碼頭來加速模型的推理速度，而無需引入額外的草稿模型，這種方法允許研究人員在單個 GPU 上微調大模。測試結果顯示，Medusa 可以将 LLM 的生成效率提高約 2 倍。

https://www.chinaz.com/2023/0913/1558833.shtml

清華聯合北郵和微信團隊推出多智能體宇宙，可模拟各類社會實驗場景

清華大學聯合北郵和微信團隊推出了一個名爲 "AgentVerse" 的多智能體宇宙，專門針對大語言模型開發，已在 GitHub 獲得 1.1k 星标。該項目簡化了使用大語言模型構建自定義多智能體環境的過程，隻需幾行簡單配置即可模拟各種社會實驗場景，如 " 囚徒困境 " 和 "NLP 課堂 "。

https://www.thepaper.cn/newsDetail_forward_24583658

阿裏雲通義千問 AI 大模型已通過備案，正式向公衆開放

9 月 13 日消息，阿裏雲今日宣布通義千問大模型已首批通過備案，并正式向公衆開放。目前，OPPO、得物、釘釘、淘寶、浙江大學等已與阿裏雲達成合作，基于通義千問訓練自己的專屬大模型或開發大模型應用。

https://www.ithome.com/0/718/755.htm

知網推出 "AIGC 檢測服務系統 "，用以識别學術文本中 AI 生成内容

9 月 13 日消息，同方知網官網今日發布公告，宣布全新推出 "AIGC 檢測服務系統 "，号稱曆時半年，探索 AIGC 運行規律并攻克内容識别、算法效率、可信評估等技術難題，經大數據測試、檢測效果驗證、檢測效率調優等服務優化改進。首次提出 " 知識增強 AIGC 檢測技術 " 和若幹檢測算法，從語言模式和語義邏輯兩條鏈路，用 AI 對抗 AIGC，最終實現識别學術文本中的 AI 生成内容。

https://www.ithome.com/0/718/925.htm

Stability AI 發布文本生成音頻産品 Stable Audio

9 月 14 日消息，Stability AI 公司近日推出 Stable Audio，可基于用戶輸入的文本内容，自動生成多種類型和風格的音頻内容，包括音樂、語音、環境聲、特效等。Stability AI 宣稱，Stable Audio 模型可以在一秒内渲染出 95 秒的立體聲音頻，并且隻需要一個 NVIDIA A100 GPU。

https://new.qq.com/rain/a/20230914A015WO00

谷歌被曝小範圍測試 Gemini，比訓練 GPT-4 算力大 5 倍

9 月 15 日消息，據三位直接知情人士透露，谷歌已經允許一小部分公司使用 Gemini 軟件的早期版本，意味着谷歌即将将其納入消費者服務，并通過公司的雲計算服務出售給企業；同時，Gemini 已開始在新的 TPUv5 Pod 上進行訓練，算力高達～1e26 FLOPS，比訓練 GPT-4 的算力還要大 5 倍；另外，Gemini 的訓練數據庫爲 Youtube 上 93.6 億分鍾的視頻字幕，總數據集大小約爲 GPT-4 的兩倍。

https://36kr.com/p/2432997666886022

微軟開源 EvoDiff，用 AI 生成蛋白質框架

9 月 15 日消息，微軟開源了一個蛋白質生成框架 EvoDiff。該框架使用 AI 技術，能夠在沒有目标蛋白質結構信息的情況下，生成生成高保真、多樣化的蛋白質序列。EvoDiff 的核心是一個擁有 6.4 億參數的模型，該模型通過使用來自不同物種和功能類别蛋白質的數據進行訓練，使模型具備生成高質量蛋白質序列的能力。創新之處在于，它不再依賴蛋白質結構信息，而是基于蛋白質序列來生成蛋白質。

https://www.kejixun.com/article/582034.html

Arm 正式 IPO，上市首日大漲近 25%

9 月 14 日，作爲今年目前最大 IPO，英國芯片設計公司 ARM 正式登錄納斯達克，首日漲超 25%，市值達 650 億美元。當今幾乎所有的手機芯片，都是基于 ARM 的架構設計的，除此之外，ARM 架構在汽車、智能手表等行業也有較高的市占率。ARM 表示，由于數據中心和人工智能芯片需求的推動，預計本财年收入增長 11%，2025 财年收入增長率能達到 20% 左右。

https://36kr.com/p/2432884592546432

字節團隊發布兩個 AI 視頻項目，可實現多模态動畫生成和文本視頻編輯

9 月 15 日消息，字節團隊在 Github 上發布兩個 AI 視頻項目。一個是 MagicAvatar，主多模态動畫生成，可以将文本、視頻和音頻等不同輸入方式轉化爲動作信号，從而生成和動畫化一個虛拟人物；另一個是 MagicEdit，專注文本導向的視頻編輯，用戶進行自然語言提示，就可改變視頻風格、場景甚至替換視頻裏的對象或添加元素。目前在 Github 上，兩個項目加起來已經拿到 1000+ 星。

https://36kr.com/p/2417388284961540

百度希壤與高通達成戰略合作，拟打造元宇宙基礎設施平台

9 月 15 日消息，近期，北京百度網訊科技有限公司與高通無線通信技術（中國）有限公司在北京簽署非約束性戰略合作諒解備忘錄，将在 XR 領域展開全面戰略合作。通過此次戰略合作的宣布，雙方期望在未來開展深度的技術、市場與生态合作，其中包括雙方将在 XR 技術、生成式 AI、數字人、産業上下遊協同等方面，圍繞元宇宙 + 生态 + 行業應用共同打造新一代元宇宙基礎設施平台。

https://www.chinaz.com/2023/0915/1559598.shtml

國内多個 AI 繪畫網站疑因違規關停

9 月 15 日消息，國内多個基于 AIGC 技術建立的 AI 繪畫網站突然下線。目前，像廣大網友熟知的四必三、哩布哩布等紛紛在無預警情況下被關停，或轉移到境外域名，并在國内無法正常訪問。不少網友懷疑合規方面或出現問題。

https://mp.weixin.qq.com/s/HdwLkkhyD6OWlO4gUppVuQ

快手開啓 AI 文生圖功能内測

9 月 15 日，快手宣布在短視頻評論區開始内測 AI 文生圖功能 —— 快手 AI 玩評，用戶通過輸入各種創意文字，可一鍵生成海量風格圖片，更便捷地在評論區進行趣味互動。據悉，這是繼快手 AI 對話之後，快手在短視頻場景内探索并落地的又一 AIGC 能力，這也是業内首次在大型 App 核心業務場景評論區下應用的 AIGC 能力。

https://www.ithome.com/0/719/336.htm