行業首批！騰訊雲TI平台支持DeepSeek全系模型精調與推理

近日，DeepSeek 全系列模型在騰訊雲 TI 平台上第一時間上架，并在業内率先實現企業級精調與推理全鏈路功能。此次支持精調的模型涵蓋了滿血版 DeepSeek V3、R1 以及六款蒸餾版模型，爲金融、醫療、制造、零售等多個行業提供了更高效、便捷的 AI 模型構建及應用方案，進一步降低企業在大模型應用中的技術門檻和研發成本。

随着 DeepSeek 引發行業廣泛關注，企業客戶在模型精調與部署過程中可能面臨數據預處理難、模型訓練門檻高、在線部署及運維複雜等多重挑戰。騰訊雲 TI 平台憑借全流程 AI 開發工具，實現了從數據準備到模型部署上線的一站式解決方案。

平台内置的數據構建模塊不僅支持快速清洗、去重與格式轉換，還能根據具體任務進行 Prompt 優化。同時，通過靈活的訓練調度策略和自研的大模型計算與并行優化技術，有效加速訓練與推理過程，大幅提升資源利用率。

據悉，TI 平台同時支持公有雲、私有化版本。其中，公有雲版本在騰訊雲上開箱即用，按需訂閱；私有化版本可部署在客戶本地機房、專屬雲服務器等自有算力上，更适合金融等更高數據安全要求的場景，從而靈活滿足政府和企業的多樣化需求。

支持 DeepSeek 的兩種精調方式，滿足多樣化需求

爲适應不同行業的個性化模型構建需求，騰訊雲 TI 平台面向 DeepSeek 提供了兩種精調模式。

一、直接精調滿血版 DeepSeek。針對希望直接對原始 DeepSeek 模型進行微調的用戶，平台内置 DeepSeek 滿血版等全系模型，并預置訓練鏡像和訓練代碼，用戶隻需按平台規範準備好訓練數據，并設置學習率、叠代步數等參數，即可一鍵啓動精調任務。

在訓練階段，平台支持全參和 LoRA 兩種精調方式，爲用戶提供兼顧訓練成本和模型效果的靈活選擇，确保模型在金融、醫療等垂直領域滿足業務要求。在數據準備階段，平台内置了可高度自定義的數據标注和構建工具，顯著提升數據質量，并有效降低數據處理成本。

二、基于 DeepSeek R1 蒸餾其他較小尺寸模型。DeepSeek R1 雖具備卓越的長思維鏈（Long CoT）能力，但模型尺寸大（參數量 671B），實際推理成本較高。針對希望以更低成本、更高響應速度應用 R1 的用戶，TI 平台也支持基于 R1 蒸餾其他較小尺寸模型，可将 R1 的能力遷移至較小尺寸的 " 學生 " 模型中。

用戶首先在 TI 平台部署 DeepSeek R1 推理服務，然後調用 R1 生成包含長思維鏈的高質量蒸餾數據，緊接着進行數據清洗，最後利用這些數據對較小尺寸的 " 學生模型 "（如 Llama 3.2-3B）進行精調，從而實現知識遷移。在保留優秀推理性能的同時，大幅降低推理成本或提升模型推理速度，有效滿足高推理性能或成本敏感的場景。

提供模型評測及部署完整工具鏈，助推行業智能轉型

騰訊雲 TI 平台還提供了全面的模型評測與部署功能。模型評測包括輕量體驗、客觀評測和主觀評測三階段能力，幫助企業多維度驗證模型性能。模型部署支持多種模型框架和格式，支持異構算力和資源彈性伸縮，可将模型快速發布爲生産級 API 接口，接入企業應用。

自 DeepSeek 模型發布以來，TI 平台已成功助力多個行業客戶部署專屬 DeepSeek 服務并開展驗證工作，部分已接入企業應用。未來，騰訊雲将持續優化 TI 平台功能，依托領先的大模型訓練推理技術，爲客戶提供更安全、穩定、高效的 AI 解決方案，助推各行業加速數字化轉型。