騰訊科技訊(蘇揚)1 月 29 日,王小川旗下百川智能發布首個超千億參數大語言模型 Baichuan3,主打中文能力尤其是在醫療領域中文方面的提升。
公開資料顯示,百川智能基于 "RLHF(基于人類反饋的強化學習)、RLAIF(基于 AI 反饋的強化學習)以及叠代式強化學習方法,Baichuan3 強化了對中文的理解,尤其是詩詞歌賦的創作能力。
*Baichuan3 中文醫療相關詩詞生成演示
官方提供的數據顯示,Baichuan3 在多個權威通用能力評測如 CMMLU、GAOKAO 和 AGI-Eval 中,表現都優于 GPT-4。
*Baichuan3 與 GPT-4 通用能力基準測試對比
到目前爲止,OpenAI、谷歌等頭部大模型企業都将醫療作爲模型的重點訓練方向和性能評價的重要體系。
大模型在醫療領域的優點在于,多模态學習能力能夠整合文本、影像、聲音等多種類型的醫療數據,深層推理能力有助于複雜醫療決策的制定,而穩定的性能和知識更新能力确保了醫療建議的可靠性和時效性,同時還具備處理專業術語和複雜句式,也支持從複雜的醫療數據中學習和識别出重要的模式和特征。
優點衆多,但也要求大模型具備豐富的醫療知識、合适的 Prompt,以及模型本身的邏輯推理能力。
*Baichuan3 與 GPT3.5,GPT-4 等權威醫療評測對比
百川智能強調稱,Baichuan3 在對邏輯推理能力及專業性要求極高的 MCMLE、MedExam、CMExam 等權威醫療評測上的中文效果同樣超過了 GPT-4。
據百川智能介紹,爲了給 Baichuan3 注入豐富的醫療知識,官方在模型預訓練階段構建了超過千億 Token 的醫療數據集,包括醫學研究文獻、真實的電子病曆資料、醫學領域的專業書籍和知識庫資源、針對醫療問題的問答資料等。數據集涵蓋了從理論到實際操作,從基礎理論到臨床應用等各個方面的醫學知識。