百川智能大模型首秀，王小川創業兩個月見成果 - 青年圖摘

6 月 15 日，大模型明星初創公司百川智能 CEO 王小川證實，其公司發展到了 " 第一個裏程碑 "。據悉，百川智能今日在 Hugging Face、Github 和 Model Scope 等平台上正式發布 70 億參數中英文大模型 baichuan-7B，這是王小川宣布入局大模型創業以來，首次公布産品進展。

據 Github 網站上的介紹，baichuan-7B 是由百川智能開發的一個開源可商用的大規模預訓練語言模型。基于 Transformer 結構，在大約 1.2 萬億 tokens 上訓練的 70 億參數模型，支持中英雙語，上下文窗口長度爲 4096。在标準的中文和英文權威 benchmark（C-EVAL/MMLU）上均取得同尺寸最好的效果。

兩個多月前的 4 月 10 日，搜狗公司創始人王小川攜 5000 萬美元啓動資金，和前搜狗 COO 茹立雲聯合創立人工智能公司百川智能式殺入大模型領域，旨在開發中國版的 OpenAI 基礎大模型及颠覆性上層應用。

兩個月來，百川智能四處招兵買馬，研發團隊已擁有包括前搜狗、百度、華爲、微軟、字節、騰訊等知名科技公司以及其他創業公司核心成員在内的數十位頂尖 AI 人才。如今首款大模型産品終于亮相，baichuan-7B 一出現便以 70 億參數量霸榜。

據了解，百川智能在萬億優質中英文數據的基礎上，爲了更好地提升訓練效率，baichuan-7B 深度整合了模型算子來加快計算流程，并針對任務負載和集群配置，自适應優化了模型并行策略以及重計算策略。通過高效的訓練過程調度通信，baichuan-7B 實現了計算與通信的高效重疊，進而達到了超線性的訓練加速，在千卡集群上訓練吞吐達到 180+Tflops 的水平。

baichuan-7B 首次亮相便展現出不凡的能力，在 C-Eval、AGIEval 和 Gaokao 中文權威評測中超過了 ChatGLM-6B 等其他大模型，成爲同等參數規模下中文表現最優秀的原生預訓練模型，在 MMLU 英文權威評測榜單上，也大幅領先 LLaMA-7B。

目前，北京大學和清華大學已率先使用 baichuan-7B 模型推進相關研究工作，并計劃在未來與百川智能深入合作，共同推動 baichuan-7B 模型的應用和發展。

熱門排行

感染新冠後亂吃藥，女子被送進ICU！這麼吃藥，無效又傷身！繁綺文 | 7天前
《孤島驚魂6：異界迷失》DLC試玩報告：一次性的解謎闖關體驗佼昌翰 | 9天前
iPhone出現大bug：未開專注模式也會靜音通知漏接大量電話衛青柏 | 5天前
王思聰能接班王健林麼？二代接班的謎之困局甄正浩 | 4天前
ChatGPT死活不認27能被3整除，網友：不是說AI要統治世界了嗎？幸聽楓 | 4天前
張蘭首回應更改國籍！曝有不得已原因，居國内無退休金醫保？佼昌翰 | 8天前
《阿凡達2》票價再創新高，但電影仍然不是個人人賺大錢的行業幸聽楓 | 3天前
年度期待大翻車，顔值再高也救不了郟君昊 | 8天前
完美日記淪為國貨反面教材衛青柏 | 8天前
秋瓷炫回中國随丈夫聚餐，于曉光摟着異性熱聊，秋瓷炫神情嚴肅集玲琳 | 5天前
普京：俄羅斯絕不會走自我封閉的道路繁綺文 | 6天前
謝娜大變樣快認不出！五官怪異臉變男相幸聽楓 | 3天前
國務院聯防聯控機制倡導互聯網醫療服務，多家互聯網平台提供7x24免費在線防疫咨詢郟君昊 | 7天前
從大企業到了小公司，要改變生存策略衛青柏 | 1天前
人際關系再重要，也要學會翻臉，做到這五點，不吃啞巴虧集玲琳 | 3天前
美财長耶倫：明年通脹料大幅下降衰退并非必然結果習又夏 | 2天前
老人家中陽台上常有鳥類停栖感染鹦鹉熱：可通過接觸疫鳥或吸入疫鳥排洩物氣溶膠感染袁曼雁 | 3天前
這陣容有點怪，怪期待的繁綺文 | 5天前
深圳首個不限購“住宅”産品入市，剩44年産權嬴覓晴 | 9天前
田亮森碟現身活動與賭王四太合照網友：長大了甄正浩 | 4天前
小米首款車型2024年量産！目标超比亞迪大衆但計劃可能有變？惠惠君 | 3天前
漲價潮前，傳統車企轉型冰火兩重天惠惠君 | 1天前
今年車市大局已定！還要不要“拯救”燃油車？嬴覓晴 | 4天前
暴雪元老克裡斯·梅森回歸《魔獸争霸》項目組，擔任創意顧問郜萌運 | 2天前
少兒體育訓練品牌尋找有意做體育素質項目的合作夥伴郟君昊 | 8天前
拍成這樣，就别再糟蹋經典了幸聽楓 | 4天前
劉嘉玲曬家中巨型聖誕樹，堆滿奢侈品，罕見穿百元衣服郟君昊 | 5天前
小米迷你主機拆解：長江存儲SSD加持郜萌運 | 6天前
飛凡汽車攜手謝晖呈現《追回來》，緻敬每一個“非凡的開始” 郟君昊 | 7天前
從馬蘇、楊幂到秦岚，魏大勳一手串起泰迪姐妹團的十年更叠衛青柏 | 8天前
江西：《關于發展科技金融支持創新創業的若幹措施》繁綺文 | 7天前
瘋搶黃桃罐頭郜萌運 | 7天前
退燒藥大賣，醫藥股又爆發，這隻新龍頭6天漲68%！繁綺文 | 8天前
黃桃剛囤完，電解質水又賣斷貨！專家提醒惠惠君 | 7天前
香港金管局：基準利率上調至4.75% 嬴覓晴 | 3天前
到底要多喪心病狂，才會想着把“傑尼龜”做成海龜湯？幸聽楓 | 1天前
蘋果為iCloud引入端到端加密實現高級數據保護寸飛蘭 | 7天前
昨天6.5，今天逆襲華語十佳繁綺文 | 7天前
宋仲基新劇引爆韓國！暗諷三星，撕開韓國财閥黑暗内幕寸飛蘭 | 8天前
1000TOPS算力時代來臨賁芳蕤 | 1天前