圖片來源 @視覺中國
銀行業究竟在如何應對大模型浪潮,招投标市場是一個值得關注的觀察切面。
早在去年 5 月,招商局集團電子招投标平台曾發布《招商證券微軟大語言模型服務采購項目 - 詢價采購公告》,透露出招商證券試圖采購微軟 Azure-Open AI 大語言模型,并探索在 " 量化投研、精準營銷、财富管理、客戶服務、智能投顧、人員效能 " 等場景的應用可能性。但在公告的數小時後,該采購項目即宣告終止,終止原因爲 " 采購需求變更 "。
下半年,招投标市場出現了數家銀行采購大模型相關服務或産品的訂單案例。據钛媒體 App 的不完全統計,工行、建行、郵儲、中行、招行、中信等數家銀行發起招标。
值得注意的是,已完成招投标的項目的候選企業與中标企業均爲國内公司,并無微軟等外企身影。同時,發起招标的銀行大多爲國有大行和頭部股份行。一位金融雲廠商高管表示,目前國内絕大部分銀行的大模型探索均是與第三方模型公司合作,從雲端調用,按需接入各類大模型 API。隻有少數頭部銀行在探索獨立全棧自研大模型或專業大模型基礎上進行微調。
招标文件透露了什麽信息
銀行大模型相關招标項目,钛媒體 APP 基于公開資料整理
目前而言,銀行大模型相關招标項目并不多,且集中于大中銀行,采購方向包括了公有雲、軟硬件等方面。
公有雲方向,建行和招行均有所動作。建行的 " 大模型分布式訓練集群實驗項目公有雲服務 " 項目,招行的 "NLP 大模型預訓練公有雲資源采購 " 項目,分别強調 " 實驗項目 " 和 " 預訓練 "。可以發現,頭部金融機構試圖在利用公有雲的資源彈性、可擴展性來進行嘗試性實驗。
大模型相關硬件設備是招标重點。
比如中信銀行發布的《大模型平台算力集群建設采購需求調研公告》稱,項目内容爲拟采購硬件産品。生成式人工智能平台建設一期算力基礎設施建設需求:采購該平台支撐模型微調訓練 / 推理所需要的算力、存儲、網絡相關硬件設備。包括大模型 GPU 服務器、GPU 專用存儲服務器、IB 交換機等。
華夏銀行的《大語言模型應用系統項目(智能算力部分)供應商征集公告》稱,本項目主要爲系統硬件設備采購,需要架構服務器及 GPU 顯卡;北部灣銀行的《廣西北部灣銀行大模型技術基礎硬件項目》表示,該行拟采購 GPU 服務器、AI 服務器與 GPU(顯卡)。
一家國有大行雲計算部門的負責人告訴钛媒體 APP,雖然售價已經非常高,大模型應用的前景也并不明朗,但爲了緊跟住行業發展,該行正大力投入資源買卡(顯卡)、持續建設。
軟件方面同樣多家銀行投入。
工商銀行招标 "NLP 大模型軟件産品一套 ";郵儲銀行則提到了 " 超大規模預訓練模型金融場景應用系統軟件開發 ";華夏銀行明确指出來招标 " 大模型應用開發平台(包含自身基礎大模型)",要求該平台核心能力包括但不限于數據構建、模型算法、模型訓練、模型壓縮、模型加速、模型運營、安全可信等,支持從數據采集、選擇大模型到微調大模型再到效果評估、部署上線等流程化操作,支持擴展引入第三方基礎大模型。
值得注意的是,招商銀行的 " 招商銀行預訓練基礎大語言模型 ( 幹億級 ) 采購項目 " 是唯一一個明确提及數據規模的項目,幹億級規模在當前的金融大模型探索中處于優勢水平。可以作爲參考的是,全球首個金融大模型 Bloom ⁃ bergGPT 爲 500 億參數。
觀察參與投标的企業和中标企業也可以一窺行業動态。
在兩項關于公有雲的招标中,目前國内的主流公有雲玩家幾乎集體出席——百度、阿裏、騰訊、京東、火山引擎(字節)、華爲、商湯,以及中國電信、浪潮、軟通動力等。最後泰和利通中标建行;火山引擎、阿裏雲以及商湯三家同時中标招行。
值得注意的是,中标建行的泰和利通(北京泰和利通科技有限公司)成立于 2016 年,注冊資本 5000 萬元,由曹靜 100% 持股,該公司官網的主要信息目前僅更新至 2020 年。雖然該公司頗爲年輕和低調,但招投标網站顯示,其客戶中不乏國家開發銀行、中國進出口銀行、中國銀行、光大銀行、中信銀行等知名金融機構。
而在招行的 " 基礎大語言模型 ( 幹億級 ) 采購項目 " 中,智譜華章、稀宇科技、百度三方投标,最後稀宇科技奪标。公開資料顯示,這家位于上海的企業是國内最早入場大模型創業的公司之一,成立于 2021 年。創始人是前商湯科技副總裁、通用智能技術負責人闫俊傑。2023 年,稀宇科技拿到了來自騰訊的 2.5 億美元投資。
折戟招行的智譜華章,是 AI 大模型市場的另一家明星公司,其成功中标郵儲銀行項目,戰勝了百度和第四範式。去年一年内,智譜華章累計獲得超 25 億人民币融資。
銀行需要什麽
在招投标公告中,少數銀行提到了具體應用場景。
比如,華夏銀行明确提到了會議紀要和報告輔助生成:
合規場景功能:大模型應用開發平台需具備合規場景相關功能,一是利用大語言模型實現合規知識智能問答,二是利用大語言模型技術提升行内現有 NLP 自動标注模型準确率,三是使用大語言模型技術提高内外規文檔相似度比對準确率。
會議紀要輔助生成、報告輔助生成功能:大模型應用開發平台需具備會議紀要輔助生成功能,根據會議錄音和相應模闆,實現會議紀要自動生成;同時需具備根據輸入素材信息自動彙總輔助生成各類報告的功能。
而上述項目中,實際的應用場景包括催收、合規相關場景、會議紀要和報告輔助生成等。
比如華夏銀行發布的《大語言模型應用系統項目(模型平台及應用場景部分)供應商征集公告》顯示,項目主要采購大語言模型應用軟件産品,包括大語言模型應用開發平台,以及依托該平台構建的大語言模型合規、會議紀要輔助生成、報告輔助生成等場景應用功能,要求在該行完成本地化部署。
廣州銀行則聚焦于催收場景,該行的信用卡中心催收大模型智能助手,
上述國有大行雲計算部門的負責人表示,該行最新的大模型應用集中在智能客服工單生成,風險經理助理,投研報告摘要生成等。
此外,數據安全性和合規性是另一大重點。部分銀行在大模型相關項目招标公告中提到,投标人應保證應用軟件不違規收集、傳輸和共享客戶個人信息和敏感數據,并且明确要求在銀行完成本地化部署。(本文首發于钛媒體 APP,作者|蔡鵬程,編輯|劉洋雪)
更多宏觀研究幹貨,請關注钛媒體國際智庫公衆号: