文 | 烏鴉智能說
在 AI 應用領域,Harvey 無疑是最耀眼的明星公司之一。
今年 7 月,Harvey 剛剛完成新一輪融資,估值高達 15 億美元。這意味着,從 22 年底完成 500 萬美元天使輪融資到跻身獨角獸行列,Harvey 隻花了不到 2 年時間。
估值蹭蹭漲,離不開那些明星投資人捧場。Harvey 的股東名單裏,不僅有 OpenAI 這樣的 AI 大模型巨頭,還有紅杉資本以及美國最大獨立風險投資人埃拉德 . 吉爾等知名投資人。
爲什麽大家都這麽看好 Harvey?一個很重要的原因是,Harvey 的經營數據跑得太好了。
在 2 年時間,Harvey 的 ARR(年度經常性收入)已經接近 3000 萬美金了。根據 Lenny 的統計,過去 10 年時間最好的 B2B SaaS 産品達到 100 萬美金的時間平均是 2 年,而 Harvey 在 2 年時間做到了 3000 萬美金。
爲什麽 Harvey 能夠實現這麽快的增長?我們又應該如何看待 AI 法律的機會?
叫好又叫座的法律 AI 助手
很多人可能不知道,法律一直都是應用新興技術最積極的領域。
此前,AI 技術(以 NLP 爲主)就已經應用在合同管理、訴訟預測、法律研究等領域。但大部分工作都以信息檢索爲主,很難對信息進行深度的處理與分析。
與過去不同,大模型對于法律 AI 軟件能力有兩方面的提升:
一是 LLM 可以用對話式的搜索方式,并且可以對數據内容進行總結提煉,以答案式回答細節問題。二是從 " 提取 " 到 " 生成 ",生成能力可以應用于起草法律合同、爲法官提供判決建議等。
這些能力也體現在 Harvey 的服務中。
作爲法律 AI 領域的扛把子,Harvey 的服務模式主要有兩種:一種是通過 fine-tune(微調)過的法律專家大模型,幫助律師完成合同分析、監管合規、索賠管理、盡職調查及更廣泛的法律咨詢服務;另一種是爲客戶構建定制模型,以達到更好的效果。
前者的服務場景主要有三個:工作流程自動化(如文件起草、審查、分析和總結)、法律研究和 AI 助理。
比如,在文件起草環節,法律工作者需要起草一份合同或者訴狀時,Harvey 可以根據提供的問答内容生成一個初步的草稿,律師可以在此基礎上進一步修改、完善。
再比如,到了法律合同審核環節,律師需要确保法律政策與最新的法規是否一緻時,Harvey 也可以幫助梳理相關法規要求,并且初步分析現有政策可能存在的合規風險點。
此外,Harvey 還能被用于輔助法律研究。比如,當律師正在處理一起知識産權案件,Harvey 可以幫助羅列相關的法律條文、判例和學術文章,加速案件準備的過程。
除了提供與法律相關的服務外,Harvey 還能幫助大型律師事務所構建自己的定制 AI 模型。比如,普華永道就與 Harvey 進行合作,訓練自己專有的人工智能模型,創造定制産品,包括爲普華的客戶定制産品服務,簡化内部法律流程等。
從目前看,Harvey 的産品取得了不錯的商業化成績。根據 Harvey 公司員工的 Brian Burns 透露,Harvey 的 ARR(年度經常性收入)已經接近 3000 萬美元了。
根據 Lenny(國外的一個科技博客網站)的統計,過去 10 年時間最好的 B2B SaaS 産品達到 100 萬美金的時間平均是 2 年,而 Harvey 在 2 年時間做到了 3000 萬美金。
過去一年中(2023 年 8 月 -2024 年 8 月),Harvey 的用戶使用率從 33% 大幅增長至 69%。與此同時,留存率表現也不錯。數據顯示,Harvey 的用戶留存率在一年後保持在 70% 左右。而 SaaS 産品的月流失率一般在 3% 到 8% 之間,年流失率在 32% 到 50% 之間。
客戶群體方面,根據 Harvey 透露,已經有超過 1.5 萬家律所排隊等待其 AI 服務,現在超 100 家律所已經付費用上了 Harvey 的産品。
目前,其官網中展示的戰略合作客戶中,不乏安理 · 謝爾曼(A&O Sherman)、普華永道(PwC)、美邁斯(O ’ Melveny)、禮德 ( Reed Smith ) 、麥克法蘭(Macfarlanes)以及 CMS 等國際頂級律所及機構。
降本驅動,AI 法律正處于爆發前夕
之所以 AI 在法律領域應用如此順利,主要得益于兩個原因:律師成本太高,降本需求強烈;以及大模型技術與法律業務邏輯高度匹配。
作爲一個依靠人力的知識密集型行業,律師的雇傭成本很高。以北京爲例,2019-2023 年北京律師年均創收高達 84 萬元。即使在最低的内蒙古,律師年均創收也有 16 萬元。在美國等發達國家,這個數據還要更高。
昂貴的人力成本,使得律師事務所更有動力推動 AI 技術的落地,來實現成本下降。而法律行業以知識 + 文本爲主的業務模式,也與大模型技術特征高度匹配。
首先,法律有相當大比例的工作是文本處理,這恰好是 AI 擅長的領域。其次,法律工作内容都有非常強的知識性,而大部分知識都有現成的文本材料可供參考,降低了大模型學習的成本。
得益于以上兩點,AI 法律行業正在快速發展。僅僅 2023 年,AI 法律行業就從 9.4 億美元,上漲到 23.9 億美元,增速超過 250%。
展望 AI 法律賽道的發展,有兩個趨勢值得關注:
首先,優質數據的價值在不斷提升。由于法律領域對信息的準确性要求很高,自然也對數據質量提出了更高的要求。但與此同時,出于數據隐私保護等原因,大模型企業獲得行業數據的途徑有限。
數據問題是所有 AI 法律公司都必須面對的問題。目前,解決數據來源問題的方法主要有兩種:
一是與大型律師事務所展開合作,在滿足客戶合規需求基礎上,獲取數據。比如,Harvey 已經與 Allen & Overy 等大型律師事務所展開合作。
二是通過收購的方式來獲得更多的行業數據。去年,湯森路透以 6.5 億美元的價格收購 AI 法律公司 Casetext,看中的就是其在過去服務客戶過程中所建立的數據優勢。截至被收購前,Casetext 的客戶有 1 萬多家律師事務所與公司法律部門。
今年,Harvey 曾一度計劃收購 vLex,但是收購最後沒有成功。vLex 就是一個全球法律智能平台,爲法律專業人士提供廣泛的法律和法規信息庫,涵蓋了來自 130 多個國家的法律和法規信息,擁有全球最大的法律和監管數據庫。
其次,将 AI 融入法律領域,需要對行業需求的深刻理解。Harvey CEO Winston Weinberg 在此前接受采訪時披露,公司 30% 左右的員工都是法律背景。
這些法律領域的專家作用是,圍繞特定法律任務構建定制的工作流和流程。Weinberg 說,隻有有經驗的律師才能在任務層面對複雜法律工作的組成和分解有深厚的專業知識,但這種類型的 " 流程數據在任何地方都不公開 "。
總結
當所有人都在尋找大模型應用的背景下,Harvey 受到投資人追捧還有另一個更重要的原因是,由于數據隐私的存在,法律 AI 應用很難被通用大模型取代。
現在大部分 AI 應用創業者都會面臨一個問題:當模型能力越來越強,怎麽保證模型不會吃掉應用産品的服務場景。
而法律就給我們提供了一個很好的思路。由于法律對數據隐私的重視,有價值的數據很難公開獲得,但輸出質量又高度依賴于這些專業數據。所以至少從目前看,通用大模型很難對法律領域的專業模型産生沖擊。