近日,DeepSeek 全系列模型在騰訊雲 TI 平台上第一時間上架,并在業内率先實現企業級精調與推理全鏈路功能。此次支持精調的模型涵蓋了滿血版 DeepSeek V3、R1 以及六款蒸餾版模型,爲金融、醫療、制造、零售等多個行業提供了更高效、便捷的 AI 模型構建及應用方案,進一步降低企業在大模型應用中的技術門檻和研發成本。

随着 DeepSeek 引發行業廣泛關注,企業客戶在模型精調與部署過程中可能面臨數據預處理難、模型訓練門檻高、在線部署及運維複雜等多重挑戰。騰訊雲 TI 平台憑借全流程 AI 開發工具,實現了從數據準備到模型部署上線的一站式解決方案。
平台内置的數據構建模塊不僅支持快速清洗、去重與格式轉換,還能根據具體任務進行 Prompt 優化。同時,通過靈活的訓練調度策略和自研的大模型計算與并行優化技術,有效加速訓練與推理過程,大幅提升資源利用率。
據悉,TI 平台同時支持公有雲、私有化版本。其中,公有雲版本在騰訊雲上開箱即用,按需訂閱;私有化版本可部署在客戶本地機房、專屬雲服務器等自有算力上,更适合金融等更高數據安全要求的場景,從而靈活滿足政府和企業的多樣化需求。
支持 DeepSeek 的兩種精調方式,滿足多樣化需求
爲适應不同行業的個性化模型構建需求,騰訊雲 TI 平台面向 DeepSeek 提供了兩種精調模式。
一、直接精調滿血版 DeepSeek。針對希望直接對原始 DeepSeek 模型進行微調的用戶,平台内置 DeepSeek 滿血版等全系模型,并預置訓練鏡像和訓練代碼,用戶隻需按平台規範準備好訓練數據,并設置學習率、叠代步數等參數,即可一鍵啓動精調任務。
在訓練階段,平台支持全參和 LoRA 兩種精調方式,爲用戶提供兼顧訓練成本和模型效果的靈活選擇,确保模型在金融、醫療等垂直領域滿足業務要求。在數據準備階段,平台内置了可高度自定義的數據标注和構建工具,顯著提升數據質量,并有效降低數據處理成本。
二、基于 DeepSeek R1 蒸餾其他較小尺寸模型。DeepSeek R1 雖具備卓越的長思維鏈(Long CoT)能力,但模型尺寸大(參數量 671B),實際推理成本較高。針對希望以更低成本、更高響應速度應用 R1 的用戶,TI 平台也支持基于 R1 蒸餾其他較小尺寸模型,可将 R1 的能力遷移至較小尺寸的 " 學生 " 模型中。
用戶首先在 TI 平台部署 DeepSeek R1 推理服務,然後調用 R1 生成包含長思維鏈的高質量蒸餾數據,緊接着進行數據清洗,最後利用這些數據對較小尺寸的 " 學生模型 "(如 Llama 3.2-3B)進行精調,從而實現知識遷移。在保留優秀推理性能的同時,大幅降低推理成本或提升模型推理速度,有效滿足高推理性能或成本敏感的場景。
提供模型評測及部署完整工具鏈,助推行業智能轉型
騰訊雲 TI 平台還提供了全面的模型評測與部署功能。模型評測包括輕量體驗、客觀評測和主觀評測三階段能力,幫助企業多維度驗證模型性能。模型部署支持多種模型框架和格式,支持異構算力和資源彈性伸縮,可将模型快速發布爲生産級 API 接口,接入企業應用。
自 DeepSeek 模型發布以來,TI 平台已成功助力多個行業客戶部署專屬 DeepSeek 服務并開展驗證工作,部分已接入企業應用。未來,騰訊雲将持續優化 TI 平台功能,依托領先的大模型訓練推理技術,爲客戶提供更安全、穩定、高效的 AI 解決方案,助推各行業加速數字化轉型。