全球很多人都開始相信,以 ChatGPT 爲代表的大模型,将帶來一場 NLP 領域乃至整個人工智能的技術革命,影響遍及各行各業。
那麽,金融機構和科技企業,應該以怎樣的姿态邁入新的洪流?
前不久,有 " 中國智能科學技術最高獎 " 之稱的吳文俊人工智能科學技術獎,正式公布了 2022 年度獲獎名單。
其中,度小滿建設的 " 智能化征信解讀中台 " 工程,率先将大型語言模型 LLM、圖算法應用在征信報告的解讀上,榮獲了吳文俊人工智能科技進步獎,成爲唯一入選的金融科技公司。
大模型應用價值到底在哪裏,如何落地?是一道新技術從實驗室走向産業的必答題。
度小滿的 " 智能化征信解讀中台 " 工程,就帶來了技術 + 應用的雙重答案。
征信報告是識别個人信用的最重要風控手段,報告中包含大量非結構化的征信數據,比如大量的文本信息,這些征信數據的複雜性和多樣性,很難使用傳統的數據處理方式進行分析。而度小滿 " 智能化征信解讀中台 " ,能夠将報告解讀出 40 萬維的風險變量,将銀行風控模型的風險區分度提升了 26%,切實在銀行信貸場景中發揮作用。
這背後的技術是度小滿率先将大型語言模型 LLM、圖算法等新技術應用在征信報告的解讀上," 智能化征信解讀中台 " 包含了 "3 個平台 -1 個特征生成框架 -3 個模型 ",讓征信報告解讀進入到圖機器自動學習階段。
大模型重新定義金融科技
NLP 長期以來是一個 AI 領域基礎而 " 冷門 " 的學科,全世界的 NLP 公司都比較少,度小滿爲什麽還要堅持研究 NLP 領域?大模型時代, NLP 能給金融領域帶來哪些變化?
先說大模型。
金融文檔、信息處理等 NLP 任務貫穿整個金融領域,讀文檔、查文檔、寫文檔,是金融機構各個業務場景中的基礎工作。以往,這些領域的智能化,使用傳統 NLP 範式去開發相關模型,數據标注成本高,開發交付周期長,維護困難。
LLM 用預訓練 + 精調 + 提示的新方法,能夠用一個模型處理多個任務,甚至未曾見過的通用任務,這就使模型出現了一種智能 " 湧現 " 現象,看起來更有智慧、理解能力更強了,所以能對金融業務場景中的數據信息和隐藏知識進行更高效的挖掘和理解。
有了超大規模的預訓練語言模型 LLM 作爲基礎設施,可對金融機構的全棧場景進行重塑,融入 NLP 能力。其中較爲典型的場景包括:
信貸輔助決策,基于強大的語義理解能力,讀懂非結構化數據,包括财務報告自動化解析、數據智能挖掘、信貸流水材料智能處理、宏觀行業分析、風險事件傳導分析等。
業務審核及研報解析,包括招股書智能審核,财務數據分析,審計報告自動化比對,非結構化數據分析。
這些場景都可以通過 LLM 加快自動化,降低 NLP 應用成本,提升效率,爲金融機構的智能化加速。
再說自然語言交互。這一輪範式轉換的核心特點就是交互(chat),AI 獲得了世界知識和強大的長文本生成能力,從而提供更自然的人機交互體驗,這會給金融領域與人打交道的服務都帶來變革。其具有代表性的場景有:
智能客服:快速、高效、低成本地響應用戶需求,滿足個性化需求,提升服務半徑和服務質量。
智能營銷:洞察理解用戶需求和情緒,讓産品和用戶更精準地匹配;一鍵生成海報、視頻等創意内容,提升營銷效率。
度小滿 CEO 朱光認爲,大模型技術正在重新定義金融科技(Fintech),ChatGPT 的出現,意味着所有圍繞移動互聯網、AI 1.0 的競争和競争優勢正在告一段落。
站在大模型時代的前沿,
度小滿的五年步履
近期,百度基于文心大模型技術推出的生成式對話産品 " 文心一言 "(英文名:ERNIE Bot)開放生态合作,度小滿成爲首家接入的金融科技公司。
基于文心一言的大模型技術基座,結合度小滿業務場景積累的金融行業知識和數據進行交互式訓練,有望打造出适配中國金融行業的,全新的智能客服、智能風控、智能交互服務。
這一次,度小滿站到了大模型時代的前沿,并不是偶然和運氣,金融領域 NLP 應用,這條路度小滿已經走了五年。
從 2018 年創立之初,度小滿就引入了大量 NLP 人才,成立 AI 部門,在 NLP 技術上發力。
2021 年,在微軟舉辦的 MS MARCO 比賽中的文檔排序 Document Ranking(文檔排序)任務中,度小滿的 AI-NLP 團隊排名第一并刷新紀錄。此外,團隊研發的軒轅 ( XuanYuan ) 預訓練模型也在 CLUE 分類任務中排名第一。
自然語言處理 NLP 是 AI 皇冠上的明珠,往遠了說,語言是進入人類認知智能的一扇大門,是抵達通用人工智能的一座橋梁。往近了說,人人皆可 chat(聊天),語言本身就具備服務每一個人,連接每一個人的低門檻和大能量,和關乎每一個人的金融服務碰撞在一起,所醞釀的商業機會也是巨大的。