開放API進軍To B，百川智能發布閉源大模型Baichuan2-53B

作者 | 周愚

編輯 | 鄧詠儀

36 氪獲悉，9 月 25 日，百川智能正式發布了 Baichuan2-53B 閉源大模型，同時還一并開放了該模型的 API 接口，正式進軍 To B 領域，開啓商業化進程。

百川依舊保持着 " 小步快跑 " 的模型發布速度。這已是自 4 月 10 日成立以來，百川智能發布的第 6 款大模型，平均下來幾乎是每 28 天推出一個大模型。

對比上月初發布的 Baichuan1-53B，Baichuan2-53B 在數學、邏輯推理等能力上均有顯著提升，還在模型幻覺方面表現良好。百川智能稱，該模型是 " 目前國内幻覺問題最低的大模型 "。

據百川智能，在 Baichuan1-53B 的基礎上，Baichuan2-53B 的邏輯推理能力提升了 100%，數學能力提升了 31%。此外，Baichuan2-53B 在語言理解能力、文本創作能力和知識問答能力上，也分别有 29%、18% 和 9% 的提升。

圖源：企業供圖

在模型幻覺方面，Baichuan2-53B 采取了兩方面的改進措施。一方面，百川增加了模型的數據規模、提升數據質量，另一方面也通過調用搜索等外部工具讓模型能夠獲取實時信息。

百川智能使用 FacTool 評測後的結果顯示，Baichuan2-53B 的綜合得分爲 140.5，在主流基礎大模型中僅排在 GPT-4 之後，處于國内領先水平。

據悉，FacTool 是由上海交通大學、卡内基梅隆大學、香港城市大學、Meta 等機構學者共同提出的一款通用框架，能夠查核大模型生成内容的事實準确性。

具體而言，Baichuan2-53B 獨創了一套數據質量體系，以低質、優質爲标準将數據進行分類，确保 Baichuan2-53B 始終使用優質數據進行預訓練。信息獲取方面，Baichuan2-53B 也對指令意圖理解、智能搜索和結果增強等多個模塊進行了升級。

除了能力升級之外，開放 API 接口也是此次發布的一大亮點。企業和開發者可以通過 API 将 Baichuan2-53B 集成至他們的應用程序和服務中，适配用戶在智能客服、智能寫作、智能推薦等多種不同場景的需求。

在安全合規問題方面，作爲首批通過《生成式人工智能服務管理暫行辦法》備案的大模型企業，百川智能爲 Baichuan2-53B 打造了覆蓋大模型預訓練、精調、推理全周期的安全增強。

值得一提的是，Baichuan2-53B 的 API 接口對 OpenAI 的接口高度兼容，客戶可以實現快速遷移，降低模型的部署和轉換成本。