在我看來,2025 年絕對能稱得上是中文大模型的颠覆之年。
DeepSeek 的橫空出世,不僅打破了英偉達主導的 " 算力決定一切 " 的刻闆印象,也打破了美國在大模型領域的長期主導地位,甚至一度挑起了全球大模型領域的價格戰,讓更多的人能夠體驗到大模型帶來的樂趣。
至少從抖音、快手上的反應來看,對普羅大衆而言,DeepSeek 的出現确實把 " 人工智能 " 這樣一個遙不可及的概念帶到了人們身邊。
哪怕是我這個浸淫大模型兩年半的雷科技練習生,在過年期間不僅沒少給身邊的父母親戚介紹這 DeepSeek 到底是什麽,自己也是時不時就拿起手機來玩一下,沒辦法,能在不要錢的基礎上提供這種問答質量的中文大模型,目前也就 DeepSeek 能做到了。
要說有什麽問題嘛,還得是這服務器的問題了。

特别是我這邊發出請求,然後看着 DeepSeek 在那裏轉個半天,最終卻隻能憋出個" 服務器繁忙,請稍後再試 "的時候,那種挫敗感是真的難受,讓人迫切想要在本地部署一個屬于自己的 DeepSeek 推理模型。
問題就出在成本上,按照常理來說,想要購入一台能在本地運行大模型的設備,那要不就是售價在 5000 元以上的 AI PC 筆記本,要不就得自己着手去裝配一台搭載獨立顯卡的整機,不管哪個選擇對普通消費者來說都不夠友好。
不過将預算壓縮到極緻,然後搭配出一套「能用」的主機,正是每一位 DIY 玩家的終極樂趣,而這給我帶來的挑戰就是,如果真的想弄一台可以本地運行 DeepSeek 模型的電腦,到底需要多少錢?
我的答案是,400 元。
盡管近期正經的内存和硬盤有價格上漲的趨勢,但是在洋垃圾這邊其實價格變化倒是不大,甚至一批早年的洋垃圾 CPU 和礦卡 GPU 還有價格下跌的趨勢。在如今大模型潮流席卷而來的背景下,我甚至不準備拘泥于辦公影音需求,決定挑戰一下用四百塊錢的預算,試着去打造出一套性價比頗高的入門級本地大模型主機。
至于具體應該怎麽操作,最終成效是否如意,跟着我一起看下去自然就知道了。
1 越陳越香的洋垃圾
既然說了要在 400 塊内搞定,那麽如何在盡量低的價錢内完成整機的裝配就變得至關重要了。
在 CPU 的選擇上,我直接從 PDD 上撿了一顆Intel® Core™i3-4170,售價 22 元。
該處理器爲二核四線程,3.7GHz 主頻,沒有睿頻能力,具備 3MB 智能緩存,采用 22nm 制程工藝的 Haswell 架構,而它最大的特點就是擁有一顆 HD4400 核顯,這也是我選擇它的關鍵。

(圖源:PDD)
俗話說得好,低價 U 配低價闆嘛。
所以主闆的話,我就選擇購入了一塊銘瑄 MS-H81M Turbo,隻有兩根 DDR3 内存插槽不說,甚至都沒有 HDMI 輸出接口,也沒有 M2 硬盤位,USB 3.0、SATA III 接口都隻有兩個,但是它在 PDD 上面隻要 79 塊錢。
這加起來僅需 100 左右的闆 U 套裝,性價比放在今時今日也是出類拔萃的。

(圖源:雷科技)
這種 CPU,散熱就不用太擔心了。
PDD 上面 14.9 包郵寄過來的雙熱管風冷散熱器,雖然外觀上是醜了一點,簡陋了一點,但是用來壓我這一套超低價配置肯定是綽綽有餘了。

(圖源:雷科技)
至于顯卡嘛,近期閑魚上面流出了一大堆 P106-090 和 P106-100 礦卡,其中前者的價格普遍在 70 塊錢左右,後者的價格普遍在 120-140 塊錢左右。
兩者之間最大的差别在顯存上,P106-090 僅有 3GB 顯存,而 P106-100 則有 6GB 顯存,盡管我這次的初衷并不是爲了遊戲而來,但是更高的顯存規格确實可以運行更高效的本地大模型,所以我最終還是拿下了一張技嘉的 P106-100,售價 130 元。

(圖源:雷科技)
最後,給它簡單配上兩根雜牌 DDR3 内存,組成内存雙通道,用一個 300W 長城電源供電,一塊 120GB SATA SSD 做系統盤,用上次裝機剩下來的大水牛矽脂湊合湊合,最後再配上個 20 塊錢的電腦城小機箱 ...
完成!請欣賞一下我用四百元裝機的成果吧。

(圖源:雷科技)
然後是我給出的參考價格表,感興趣的大夥也可以試着照這張表格上的配置自己配一下,總之價格上不會差太多。
你要是更追求性價比的話,甚至把機箱換鞋盒也不是什麽大問題。

(圖源:雷科技)
裝機完成,點亮主機!
先做個簡單的性能測試,作爲多年服役的老将,Intel® Core™i3-4170 的性能也就那樣,即便是在用 TrottlesStop 解鎖功耗的情況下,也就差不多相當于移動端酷睿六代、酷睿七代處理器的水平。

(圖源:雷科技)
在實測環節中,CPU-Z 測試單核跑分有 373.4 分,多核跑分有 1025.2 分,在 CINEBENCH 測試标準下,CINEBENCH R20 多核 824cb、單核 346cb,CINEBENCH R23 多核 1914cb、單核 905cb。
亮眼肯定是不夠亮眼,但是拿來日常辦公、輕度娛樂倒是夠了。

(圖源:雷科技)
再看看 GPU 部分,我手上這張技嘉 P106-100 采用 16nm 工藝打造,顯卡核心爲 GP106,核心頻率爲 1506MHz,可提升到 1709MHz,具有 1280 個着色單元,支持 DirectX12,顯存規格爲 6144MB/192Bit GDDR5 内存,顯存頻率可達 2002MHz。
在測評 DX11 性能的 Fire Strike 測試中,P106-100 在 Extreme 測試中取得了 6490 分的圖形分數;在測評 DX12 性能的 TimeSpy 測試中,P106-100 在基本測試中取得了 4428 分的圖形分數。


(圖源:雷科技)
這個性能表現和 GTX1060 差不多,甚至能和移動端 RTX 3050 碰一碰了。
存儲方面,我們斥資 40 元購入的這塊雜牌 128GB SATA SSD 硬盤,順序讀寫速度達到 505.24MB/s 和 369.63MB/s,随機 4K 讀寫達到 132.06MB/s 和 246.55MB/s,雖然和 M2 SSD 硬盤沒得比,但是作爲系統啓動盤肯定是綽綽有餘了。

(圖源:雷科技)
至于這對雙通道的 DDR3 内存,使用 AIDA64 進行内存緩存測試,測得的讀取速度爲 18557MB/s,寫入速度爲 19889MB/s,複制速度爲 17914MB/s,延遲爲 67.2ns,給這台電腦用可以說是剛剛好。

(圖源:雷科技)
2 百元機,用上 DeepSeek
既然目的是在幾百塊錢的預算下,打造出一套可用的本地 DeepSeek 主機,那麽體驗肯定是我們最關注的一環。
首先,要說真正的 DeepSeek-R1,那便隻有一個版本,即 671B 的原始版本,其中包含大量的參數,推理精度确實高,但需要大量計算資源,而且顯存至少爲 1342GB。

(圖源:HuggingFace)
這顯然是 P106-100 承受不起的,也沒有哪張消費級顯卡能承擔得起就是了,官方推薦的方法是用 16 張 NVDIA-A100 80GB 顯卡,或者是組成 Mac 電腦集群,用高速度的統一内存去跑。
像我們這種消費級顯卡,就隻能用" 蒸餾模型 "。
所謂蒸餾模型,可以看成 " 老師教學生 ",通過知識蒸餾,教更精簡的模型學會複制較大模型的行爲,擴充性能,減少資源需求,而用 DeepSeek-R1 蒸餾的話,主要就是給這些模型加入 " 深度推理 " 的概念。
再降低一下模型精度,就能看到我們能夠部署的蒸餾模型。

(圖源:HuggingFace)
然後根據 Unsloth 提供的報告,DeepSeek-R1-Distil-Qwen-7B 是符合需求的蒸餾模型中表現最出色的,各方面測試成績均超越了理論參數更多的 DeepSeek-R1-Distil-Llama-8B。
那麽我們今天要部署的,自然就是DeepSeek-R1-Distil-Qwen-7B。

目前想在 PC 本地部署 DeepSeek 有兩種辦法,其中最常見的應該是Ollama+Chatbox AI的組合。
所謂 Ollama,其實就是一款比較流行的本地大模型服務端工具,部署起來也很簡單,隻要在 Ollama 官網搜索 DeepSeek-r1,下面就會有不同大小的蒸餾模型渲染,然後搭配客戶端啓動就行了。

(圖源:Ollama)
安裝後,Ollama 一般就在本地的 11434 端口開啓服務了,但此時你隻能在終端中進行交互,但是要獲得像 DeepSeek 官網一樣的體驗,還是需要額外的前端客戶端才行。
而 Chatbox AI,就是最常見的一款前端産品。
不同于服務端的純文字内容展示 ,Chatbox AI 将大部分設置、功能進行了圖形化,使用戶的體驗更加直觀,而且這款産品支持衆多本地 AI 模型和 API 接口,自然也可以使用本地 Ollama 11434 端口的服務。
接入之後,大概就是這個樣子。

(圖源:雷科技)
你可以在 Chatbox AI 定義自己想要交互的模型人設,
但要論角色扮演的話,第二種部署方法或許會更适合一點。
爲你介紹 Koblodcpp,這是一款整合 Koblod.AI 界面的 llamacpp 啓動程序,可以運行目前外網流行的 GGUF 格式本地大模型,甚至可以整合語音大模型和繪圖大模型,實現在對話的同時,生成語音和對應場景的效果。
隻要在 HF-Mirror 下載對應的大模型,然後就能用 Koblodcpp 啓動了。

(圖源:雷科技)
使用 Koblodcpp,你就可以加載通用格式的角色卡,實現和各種不同的角色對話交流的獨特體驗。
如果這還不夠,你還能夠借助 Koblodcpp 的端口部署SillyTarven,後者是目前全網公認的最好用的大模型角色扮演前端,能夠幫助用戶實現對話邏輯的定義,對用戶自身人設的定義,加載補充世界觀的 Lorebook 和載入圖片、動圖以及互動代碼來完善角色扮演體驗。
甚至 ... 可以讓 DeepSeek 實現破限,做到一些雲端大模型做不到的事情。
簡單介紹完部署方法後,接下來就該進入實測環節了。
用一些常規問題和它進行交互,就能看到詳細的推理過程,應付一些正經的初高中語文、數學、英語問題,本地部署的 DeepSeek 體驗起來還是不錯的。


(圖源:雷科技)
詢問一些關公戰秦瓊的問題,文學創作能力看起來也不賴。

(圖源:雷科技)
不過在比較複雜的數學、邏輯難題裏,本地部署的 DeepSeek 表現就比較一般了,有不少邏輯推理題甚至會出現算不出答案的情況。

(圖源:雷科技)
因爲沒有聯網的緣故,目前本地部署的 DeepSeek 模型的知識庫是截至 2023 年的,沒有比較新鮮的素材,因此一些有時效性的問題自然無法作答。

(圖源:雷科技)
至于速度的話,在限制回複長度爲 1024 代币的情況下,應付一道高中數學題的思考過程爲 127s(即兩分鍾)左右,這個速度和原版 DeepSeek 之間差别不大,深度思考的特性讓本地和雲端的體驗大大拉近。

(圖源:雷科技)
當然了,因爲思考太長的原因,本地部署的 DeepSeek 确實就不大适合聊天用了,喜歡聊天的建議更換 Casuallm 大模型進行體驗。
3 總結:低配置也能跑,
但穩定性欠佳
優點:
1、成本預算低廉;
2、确實能運行本地大模型。
缺點:
1、二手零部件無保障;
2、礦卡驅動非常容易掉,白屏問題時有發生。
論性能,這款預算不到 400 元的電腦主機其實還不錯。
盡管 CPU 規格老舊、礦卡表現不穩定,但是這台廉價主機确實能完成 DeepSeek 本地大模型的部署,在組裝完成後的這段時間裏,它一度成爲公司局域網内部的 AI 終端,還可以部署本地 AI 繪圖等一系列能力,算是實至名歸的 AI PC。
雖然沒有具體測試,但是近 4500 分的 TimeSpy 圖形分,即便是《孤島驚魂 6》這樣的 3A 大作,這款機子也能在 FHD 低畫質下保證 60 幀穩定運行,應付《英雄聯盟》這類網遊應該是綽綽有餘的,也可以當一台入門的遊戲主機來用。

說是這麽說,問題當然還是有的。
先說這台機子,爲了搞好這台機子我也是前後折騰了半天。 P106-100 這張礦卡多次出現掉驅動導緻電腦白屏,需要用 DDDU 卸載驅動再重裝的情況,至于那個二手電源後面直接癱瘓了,還得去 PDD 上面扯皮商家才肯換貨。
目前閑魚上面還有不少和我組裝起來的這台機子配置類似的洋垃圾整機,售價普遍在 350-400 元左右,目标受衆很明顯是剛上大學或者走出社會的年輕群體,個人建議大夥别去購買這些産品,一分錢一分貨可不是開玩笑的。
再說說 DeepSeek,目前市面上所有的本地 DeepSeek 部署教程,包括我們在内,實際上部署的都是經過 DeepSeek 蒸餾的通義千問模型,回答一些基礎問題,簡單測試深度思考還行,複雜一點的邏輯思考能力,這本地部署的版本和全參數的版本之間的差别可不是一星半點。
隻能說,真要想追求不卡的全參數 DeepSeek 體驗,整個 API 接口可能是更加合理的方法。