12 月 23 日,百川智能全鏈路領域增強大模型 Baichuan4-Finance 正式發布。不同于行業常見的大語言模型,Baichuan4-Finance 主要面向金融領域,但并未放棄通用能力。
在 FLAME-Cer 評測中,Baichuan4-Finance 整體準确率高達 93.26%,領先 GPT-4o 近 20%,其中銀行、保險、基金、證券等多個項目的從業資格認證測試中,Baichuan4-Finance 準确率更是達到了 95% 以上。
(圖源:百川智能)
在更偏向一級應用場景的 FLAME - Sce 和國内主流開源金融評測基準 FinanceIQ 兩大評測中,Baichuan4-Finance 整體成績均優于 GPT-4o 和開源金融大模型 XuanYuan3-70B-Chat。
據百川智能介紹,爲實現模型在提升專業能力的同時,不損失通用能力,百川智能專門打造了一套全鏈路領域增強方案,行業首創領域自約束訓練技術,涵蓋高質量數據集構建、模型預訓練、微調、強化學習等流程。Baichuan4-Finance 正是該方案的最新成果,其高質量金融數據集全面嚴謹,包含核心專業金融知識數據及實踐應用類數據,爲提升金融能力提供良好支撐。
此外,百川智能還在領域自約束訓練中引入高精通用數據混合訓練,以确保通用能力能夠穩步增長。後訓練環節,百川智能通過合成數據、指令數據進行有監督微調,針對金融領域特定場景進行樣本增強,進一步提升了大模型的性能表現。
對于 Baichuan4-Finance,軟通動力表示,該大模型的通用能力和專用能力均完美契合他們的需求,部署該大模型後,用戶滿意度提升了 20%。
在大模型普及度日益提高的今天,如何權衡大模型的專業能力和通用能力已成爲令 AI 企業頭疼的難題。若使用大量通用數據訓練大模型,很可能造成數據污染,降低大模型在專業領域的準确性,而不使用通用數據訓練大模型,則可能導緻大模型的通用能力增長停滞乃至下降。
百川智能通過行業首創的自約束訓練技術和全鏈路領域增強方案,以專業金融知識和實踐應用類數據訓練大模型,用于提升 Baichuan4-Finance 面對金融領域專業應用場景時的能力。特選高精通用數據用于混合訓練,則能夠在避免外部數據污染的同時,提升 AI 大模型的通用能力。
(圖源:百川智能)
該方案對于 AI 企業的數據樣本篩選、算法、監督和調整能力提出了極高的要求,從多項測試表現來看,Baichuan4-Finance 在金融領域的能力已跻身第一梯隊,遠超 GPT-4o 和 XuanYuan3-70B-Chat。
百川智能表示,已與華爲、中科曙光、軟通動力、達觀數據、中國移動 / 電信 / 聯通等軟硬件公司及運營商達成合作,爲愛奇藝、完美世界遊戲、360 集團等數千家企業提供了服務。
通用大語言模型競争烈度較高,且難以實現盈利創收,AI 公司爲大模型加入專業能力,面向特定人群是行業趨勢。率布局金融領域的百川智能,或将通過 Baichuan4-Finance 奠定行業地位,與更多企業達成合作,并爲個人用戶提供更加完善的使用體驗。