騰訊雲發布AI原生向量數據庫，提供10億級向量檢索能力，已支撐騰訊視頻等業務

智東西（公衆号：zhidxcom）作者 | ZeR0編輯 | 漠影

智東西 7 月 4 日報道，今日下午，騰訊雲發布 AI 原生（AI Native）向量數據庫 Tencent Cloud VectorDB。該數據庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景，是國内首個從接入層、計算層、到存儲層提供全生命周期 AI 化的向量數據庫，将于 8 月正式登陸騰訊雲。

向量數據庫專門用于存儲和查詢向量數據。如果把大模型比作人的大腦，那麽向量數據庫就如同海馬體，能夠爲大模型提供長期記憶。向量數據庫可以突破時間和空間上的限制，助力企業廣泛挖掘數據價值。據悉，騰訊雲向量數據庫最高支持 10 億級向量檢索規模，延遲控制在毫秒級，相比傳統單機插件式數據庫檢索規模提升 10 倍，同時具備百萬級每秒查詢（QPS）的峰值能力。

一、騰訊雲定義 AI 原生向量數據庫，加速企業在大模型時代的 AI 化進程

騰訊雲數據庫副總經理羅雲談道，向量數據庫是企業數據和大模型之間的橋梁，能夠彌補大模型在時間和空間上的限制。

向量數據庫能夠解決大模型預訓練成本高、沒有 " 長期記憶 "、知識更新不足、提示詞工程複雜等問題，加速大模型落地行業場景。

企業拿到非結構化數據後，通過神經網絡進行向量化，進而存儲到向量數據庫中，進行存儲和查詢，這樣可以極大地提升效率和降低成本。

羅雲認爲，AI 原生時代已經到來，" 向量數據庫 + 大模型 + 數據 "，三者将産生 " 飛輪效應 "，共同助力企業步入 AI 原生時代。

在 AI 原生時代，數據的使用範式如下圖所示，比如處理大段 PDF 文件，會先經過文本分割，把文字分解成小段文字，然後計算層會将這些文字通過向量化（embedding）算法變成浮點數數組，再調用向量數據接口，将數據存放到存儲層數據庫。

用自然語言提出問題後，應用開發者後台會計算 " 問題 " 向量，進行基于向量的知識檢索，找到最相關的 20 個片段，整理後推給一個大模型，讓大模型幫它得出最終的答案。可以看到，客戶的數據加工流程非常複雜，要解決分段、embedding、二次 embedding 等問題。

對此，騰訊雲重新定義了 AI 原生的開發範式，提供了接入層、計算層、存儲層的全面 AI 化解決方案，讓用戶在使用向量數據庫的全生命周期都能應用到 AI 能力。

在接入層，騰訊雲向量數據庫支持自然語言文本的輸入，同時采用 " 标量 + 向量 " 的查詢方式，支持全内存索引，最高支持每秒百萬的查詢量（QPS）。

計算層在數據庫内部提供分割、embedding、精排、聚合等 AI 計算的算子，簡化客戶使用數據的成本。AI 原生開發範式可實現全量數據 AI 計算，一站式解決企業在搭建私域知識庫時的文本切分、embedding 等難題。

在存儲層，騰訊雲向量數據庫支持數據智能存儲分布，助力企業存儲成本降低 50%。騰訊雲内部按照 AI 方式進行預訓練，産生一些數據和算法，能夠更好幫助客戶動态構建索引。

騰訊雲向量數據庫有助于加速企業在大模型時代的 AI 化進程。

統計顯示，将騰訊雲向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式，可以實現 10 倍效率的提升。如果将向量數據庫作爲外部知識庫用于模型推理，則可以将成本降低 2-4 個數量級。企業原先接入一個大模型需要花 1 個月左右時間，使用騰訊雲向量數據庫後，3 天時間即可完成，極大降低了企業的接入成本。

二、多年存儲引擎和 AI 算法積澱，助力數據接入效率提升 10 倍

上述成績源自騰訊雲多年積累的存儲引擎和 AI 算法。此前騰訊雲向量數據庫的向量化能力曾多次獲得權威機構認可，2021 年曾登頂 MS MARCO 榜單第一、相關成果已發表于 NLP 頂會 ACL。

騰訊雲向量數據庫基于騰訊集團每日處理千億次檢索的分布式向量數據庫引擎 Olama。該引擎已經廣泛應用于大語言模型、推薦搜索廣告系統、音視頻和圖片審核以及去重等領域。

Olama 從 2019 年開始在 PCG 業務團隊技術孵化，如今已面向騰訊全部業務，覆蓋騰訊 6 個 BG、接入騰訊視頻、QQ 浏覽器、QQ 音樂等 30 多款國民級産品，日均搜索請求超千億，調用成功率達 100%，搜索成功率達 99.995%。

當前 Olama 能夠支持的單索引行數達到 10 億行，單實例 QPS 達 100 萬，全網 P99 響應時延小于 20ms。經過騰訊内部海量場景的實踐，使用騰訊雲向量數據庫，數據接入 AI 的效率比傳統方案提升 10 倍，運行穩定性高達 99.99%。

騰訊雲向量數據庫能有效助力産品提升運營效率。使用騰訊雲向量數據庫後，QQ 音樂人均聽歌時長提升 3.2%、騰訊視頻有效曝光人均時長提升 1.74%、QQ 浏覽器成本降低 37.9%。

騰訊 PCG 大數據平台部搜索推薦 Senior Tech Lead 鄭偉分享了騰訊内部應用騰訊雲向量數據庫的三個案例。

遊戲知幾是騰訊自研的遊戲智能 AI 産品機玩家互動運營解決方案，應用在超過 200 款遊戲上。它相當于是一個遊戲智能客服應用，能夠對玩家的個性化問題給出答案。

在遊戲領域，可以先把所有遊戲問題和答案建成标準問答庫，然後通過深度學習技術把問答庫變成一個個向量，存儲到 Olama 引擎，當用戶輸入問題，也把這個問題變成向量，再将該向量存儲到 Olama 引擎的數據庫裏做檢索，檢索後就可以得到标準的問題和答案，然後把标準問題做一層排序，将分數最高的問題推薦給用戶。

第二個案例是 QQ 浏覽器信息流推薦。這些推薦業務大量使用騰訊雲數據庫 Olama 引擎。用戶在推薦系統裏看到的新聞、視頻，以及帶推薦的物品推薦池，都輸入到大模型層，大模型有三大類（DSSM 模型、圖數據庫、序列模型），通過一個個序列大模型，将帶推薦的物品推薦詞變成一個個向量，放到 Olama 引擎裏。當用戶來到推薦系統，就可以根據用戶過去看過哪些新聞和視頻，将用戶相關行爲變成向量，到數據庫進行檢索，把檢索結果合并，推薦出最終感興趣的新聞和視頻。

另一個案例是騰訊視頻視頻關系中台。Olama 引擎能用在視頻判重和音頻判重。具體做法是把一個個視頻庫裏的視頻變成圖片幀、音頻抽出成音頻幀，或者把音頻通過轉化成文本的方式，通過深度學習技術，變成音頻向量和文本向量。當用戶輸入視頻時，就能将視頻向量、音頻向量、文本向量進行召回聚合，然後輸出結果，告訴用戶視頻的相似關系。

結語：助攻大模型普及，AI 原生向量數據庫将成企業數據處理标配

在大模型熱潮的催化下，向量數據庫進入飛速發展期。據東北證券預測，到 2030 年，全球向量數據庫市場規模有望達到 500 億美元，國内向量數據庫市場規模有望超過 600 億人民币。

向量數據庫能夠幫助企業更高效、便捷地使用大模型，将數據的價值釋放到最大。随着大模型的不斷發展和普及，AI 原生向量數據庫将成爲企業數據處理的标配。而騰訊雲向量數據庫希望走在 AI 原生時代的前排。