文|沈筱
編輯|王與桐
36 氪獲悉,北京數語科技有限公司(以下簡稱,Datablau)已完成 B1 輪融資,由考拉基金領投,老股東線性資本繼續跟投,指數資本擔任獨家财務顧問。本輪融資後,Datablau 将繼續加速重點産業布局,構建基于大模型的數據資産智能平台,進一步将 AI 技術與數據治理核心業務場景融合。此外,Datablau 也已制定上市計劃。
Datablau 成立于 2016 年,是一家數據資産管理軟件和服務提供商,主要面向企業提供從事前模型管控,到事後數據資産盤點,再到數據資産價值輸出的全棧式數據治理産品和咨詢實施服務。據介紹,公司此前已完成天使輪、Pre-A 輪、A 輪,A+ 輪共計四輪融資,投資方包括中經合集團、廣發乾和、線性資本、紅杉中國。
自上輪融資以來,Datablau 主要在産品和市場兩個方面取得了較大進展。Datablau 創始人兼 CEO 王琤介紹,迄今爲止,公司已構建了較完整的産品矩陣,完成了産品市場驗證和關鍵行業客戶拓展,并于 2021 年進入規模化商業複制的新階段。
具體而言,産品層面,Datablau 在 2021 年正式完成 Datablau DDM ( 數據模型管控平台 ) 、DAM ( 數據資産管理平台 ) 、DDC ( 數據資産目錄服務平台 ) 、DDS ( 數據安全管理平台 ) 四大平台布局。今年已發布至 6.5 版本,在對原有功能優化叠代的同時,增設了部分新功能模塊,并實現了平台對信創生态的兼容。
其中,DDM 和 DAM 是 Datablau 的兩大核心産品。DDM 旨在幫助企業實現數據源頭治理,通過模型工具,将數據标準落地,從源頭規範化管控元數據的設計成果;依托數據模型和知識圖譜,DAM 可實現自動盤點數據資産,自動執行數據檢測和生産質量問題報告。
DDC 和 DDS 則是在上述核心底座産品基礎上衍生出的産品線。DDC 是在企業實現數據治理和資産盤點基礎上,用以賦能業務部門進行數據資産搜索的平台。企業可基于統一數據授權,統一提供數據資産服務,打造數據應用;基于 DDS,企業可以建立數據安全管理體系和個人隐私保護,對數據進行智能分類分級,動态脫敏,實現千人千面的數據供給。
良好的數據治理是企業走向數字化、智能化的必要條件。在 Datablau 看來,其構建現有産品矩陣的邏輯就在于,以數據模型爲核心幫助企業搭建數據治理平台體系,從數據生産規範化、數據管理運營智能化、數據服務統一化三方面建立數據綜合能力,進而實現數據業務化,提升數據應用能力。
王琤認爲,注重體系搭建、提供完整的數據資産管理能力和智能化也正是 Datablau 與友商角逐數據治理市場的關鍵。" 相較于解決方案友商,我們更多關注産品本身,而非清洗數據、建數倉。而和同樣關注産品和工具的友商相比,Datablau 的差異化主要體現在體系化的産品布局和 AI 技術應用方面。" 王琤向 36 氪表示,依托人工智能技術,公司的 DAM、DDC 産品已經幫助大量客戶顯著提升了數據資産盤點和咨詢實施的效率。
市場方面,伴随産品線擴張,Datablau 于 2020 年開始進行橫向市場拓展,将業務範圍從金融拓展至零售、智能制造、能源、政府、物流、教育等多個關鍵行業。在落地标杆客戶,提升公司在上述行業頭部企業中市占率的同時,Datablau 也陸續與阿裏雲、華爲雲等生态夥伴達成合作。2022 年,公司正式與華爲雲達成框采,逐步推進平台化發展,将業務延展至中腰部客戶。
王琤表示,目前,Datablau 已累計服務包括中國人民銀行、建設銀行、中國人壽、中信集團、華爲、美的、徐工集團、順豐科技等 200 餘個大型企業客戶;2022 年公司營收同比增長超 180%,今年上半年也已同比實現營收成倍增長。
複購方面,王琤告訴 36 氪:" 部分企業客戶采取隔年采購的方式,複購率能保持在 60% 左右,但公司整體還處在增量市場中,除了老客戶的增購,每年有一半以上的客戶是 new booking。"
近年來,在企業自身轉型升級需求,和國家政策層面鼓勵激活數據要素潛能、促進數據流通,這兩方面因素共同推動下,國内數據治理市場穩步發展。根據 IDC 近期公布的《中國數據治理市場份額,2022》,盡管受疫情影響,2022 年數據治理市場增速下降,但數據解決方案市場規模相較 2021 年仍同比增長了 7.4%。而當前,人工智能技術又進入了新的發展階段,作爲 AI 應用落地的前提,數據治理的重要性再次凸顯。
據介紹,近兩年,Datablau 在基于深度學習算法不斷對 DAM、DDC 産品進行叠代優化的過程中,收集了大量數據反饋,構建了相應的向量數據庫,并沉澱了不同行業的數據标準和語料庫。王琤表示,這爲公司現階段引入 LLM(大型語言模型)升級相關産品、功能,優化用戶體驗奠定了基礎。
王琤認爲,數據市場正逐步走向成熟,越來越多的行業、企業客戶對數據治理的需求正在從 " 頭痛醫頭、腳痛醫腳 " 轉向體系建設。他表示,這是 Datablau 近年來跨行業市場拓展的基礎,同時也爲公司未來增長提供了動力。
談及未來發展,王琤告訴 36 氪,行業目前仍面臨兩個挑戰,也是 Datablau 謀求成長的重要着力點:
一是源端系統的規範性問題。越來越多的企業将業務系統數據模型設計和管控作爲企業開發項目的重要管理措施。這就要求 Datablau 等數據治理平台來完成數據模型設計與開發一體化(DevOps、CI/CD)的集成;
二是,現階段企業仍面臨數據治理周期長、任務重的問題,Datablau 需持續探索如何幫助企業快速實現數據賦能業務。據介紹,公司正在嘗試類似 Data Mesh 業務驅動的數據治理方式,并在最近交付的幾個項目中,得到了較好的效果。但王琤也表示,盡管近年來業務部門參與配合數據治理的意識在逐步增強,但要達到 Data Mesh 所主張的讓業務部門自主進行數據治理,還太早。
另外,王琤指出,Gartner 提出的 Data Fabric 也是值得關注的方向。他認爲,active meta data(主動元數據)是 Data fabric 較核心的部分,這意味着将元數據采集到平台,建立好庫表結構後,Datablau 需要做更多深度挖掘的工作。" 實際上我們已經開始實踐 Data Fabric 理念,比如通過 DDC 實現的數據資産智能推薦。" 王琤告訴 36 氪," 但未來還需探索更多功能,包括智能取數、拉數等。大模型的應用能再幫助我們增強這部分 AI 能力。"
團隊方面,Datablau 團隊規模已經超過 200 人,産研和交付團隊占比超過 80%,核心團隊來自數據專業領域 CA Erwin、IBM、Teradata、Informatica 等國際大廠。
投資人觀點
考拉基金合夥人戴巍表示:" 我們長期關注數字化帶來的投資機會,而數據治理是數字化建設的基礎需求之一。Datablau 擁有先進的理念和豐富的經驗,并打造出了标準化程度很高的産品矩陣,特别是其獨有的數據建模工具,有望成爲企業客戶數據治理的核心基礎設施。我們相信 Datablau 能夠憑借其對數據治理的深刻理解和極具競争力的産品,持續爲客戶的數字化建設提供優質産品和服務,保持在行業中的領先地位。"
線性資本董事總經理鄭燦表示:" 過去三年裏我們看到了公司的飛速成長,産品得到不斷升級,業務也得到良好發展。我們相信作爲中國數據治理的一家領袖企業,數語能夠更好地幫助大量的中國企業真正地理解和利用數據,做到數據驅動業務運營。"
本輪融資獨家财務顧問指數資本董事總經理韋炜表示:" 數據已經晉升爲現代企業的核心生産資料,進而推動數據治理需求的井噴。Datablau 團隊作爲行業領導者,依托先進的産品理念和紮實的技術基礎,爲各行業頭部客戶打造了标準化的全棧數據治理平台,全方位提升數據治理能力。在經濟、資本環境充滿挑戰的環境下,公司逆勢實現業績、融資的快速突破也證明了賽道與業務的強确定性。"