OpenAI o1 風格的推理大模型,有行業垂直版了。
HK-O1aw,是由香港生成式人工智能研發中心 ( HKGAI ) 旗下 AI for Reasoning 團隊 ( HKAIR ) 聯合北京大學對齊團隊(PKU-Alignment Team)推出的全球首個慢思考範式法律推理大模型。
HK-O1aw 的推理能力,在多個法律場景的測試中得到證明。該模型在合同法、消費者權益保護法等多個法律領域中均展現出色的表現,并能靈活适應各類法律咨詢場景。
以下是 HK-O1aw 模型用戶體驗演示:
提問 1: 拿衣服去幹洗後,幹洗店弄壞了衣服,根據香港法例,可否向店鋪索償?應該以什麽渠道索價?
在個案咨詢場景中,針對 " 幹洗店洗壞衣服 " 的情形,用戶咨詢 HK-O1aw 如何利用香港法例進行消費者維權。HK-O1aw 通過 " 分析香港法律條例——分析索償途徑——小額錢債審裁處的适用性——民事法庭的訴訟程序 " 完整的邏輯鏈條進行思考。最終提供用戶答案:可以進行索賠,首先建議直接聯系店鋪索賠,若無果則向消費者委員會投訴,或通過法律途徑解決。
提問 2: 商業爲什麽需要調解和仲裁?
在法律知識解答場景中,針對用戶提出 " 商業爲什麽需要調解和仲裁 ",HK-O1aw 的推理能力幫助它把問題進行拆分,按商業調解和商業仲裁的定義和功能、調解和仲裁各自的優點、适用性驗證的思路進行深度思考,并給出最終答案。
推理能力的實現,進一步保障了大模型在法律場景下法律條例引用、事實判斷、決策意見的準确性,分析角度的完備性,讓大模型在法律服務中更加專業可靠。
像這樣,一直以來都是耗時耗力且成本高昂法律糾紛處理,如今可以慢慢交給法律推理大模型來幹了。
深度推理:HK-O1aw 法律大模型的核心競争力
早期市場上的法律大模型在深度推理能力上有所欠缺。
早期的法律大模型即便能夠提供豐富的法律知識,但面對現實社會中的複雜法律糾紛,它們往往在關鍵邏輯上出現疏漏,最終難以解決法律場景下的實際問題。
HK-O1aw 通過采用 O1 風格的數據集和訓練設置,實現法律模型深度推理能力的躍升,這使得法律大模型能夠深入分析複雜的法律文本和案例,提供邏輯缜密的法律意見,滿足行業對深度分析和複雜問題解決的迫切需求。
O1 風格是什麽?
它指的是一種類似于 OpenAI o1 模型的長考能力,它側重于慢思考(slow thinking)和鏈式推理(Chain of Thought, CoT)。在法律領域,O1 風格專注于深入分析和推理,以應對法律文本和案例的複雜性。這種風格的模型技術難點主要體現在以下幾個方面:
複雜性處理:法律文本常包含專業術語和複雜的邏輯結構,O1 風格的模型必須能夠進行深入的思考和推理。
長鏈推理:爲了在複雜案件中進行全面分析和判斷,O1 風格的模型必須能夠支持更長的推理鏈條。
準确性和可靠性:O1 風格的模型必須确保模型在推理過程中的一緻性和可靠性,以避免錯誤判斷。
可解釋性:O1 風格的模型需要提供可解釋的模型輸出,以便法律專業人士理解和信任模型的結論。
想要訓練出邏輯超強的模型,豐富并且高質量的數據集必不可少。
依托于經過嚴格清洗和預處理的法律材料,HKAIR 團隊爲 HK-O1aw 構建了 15959 個包含 " 問題 - 思考 - 答案 " 的三元組,全部以簡體中文呈現,并以結構化的 JSON 格式存儲,并在 Hugging Face 平台上開源(詳見文末鏈接)。這種設計旨在模拟法律專業人士的思考過程,增強法律大模型的深入分析能力。
數據集中的問題類型廣泛,涵蓋案例分析、法律應用和法律概念解釋等多個方面,難度級别爲中級到高級,對于法律專業人士和法學院學生來說具有挑戰性。
HKGAI 團隊介紹
HKAIR Lab 隸屬于香港生成式人工智能研發中心(HKGAI)。HKAIR Lab 由香港科技大學首席副校長郭毅可教授和跨學科學院韓斯睿助理教授指導,成員主要由香港科技大學跨學科學院的博士研究生和研究員團隊組成。HKAIR Lab 與北大對齊團隊在 HK-O1aw 和 " 慢思考 " 範式下,就生成式人工智能如何賦能法律應用場景展開了合作。
爲了把握未來機遇并應對挑戰,HKAIR 研究團隊将持續對 HK-O1aw 進行優化。計劃中包括引入法律領域專家參與模型的訓練與評估,這将促進模型對法律概念的深入理解,提升其推理能力,并拓寬模型在多樣化法律場景中的應用範圍。
HK-O1aw 模型開源資源鏈接:
模型地址:
https://huggingface.co/HKAIR-Lab/HK-O1aw
數據集地址:
https://huggingface.co/datasets/HKAIR-Lab/HK-O1aw-SFT-16K
代碼地址:
https://github.com/HKAIR-Lab/HK-O1aw/