文 | 長三角 momo,作者 | 祝穎麗
周一下午 3 點,用戶打不開網易雲音樂了。宕機長達兩小時," 網易雲音樂崩了 " 登上熱搜第一。
在一個需要精神撫慰的工作日下午大面積癱瘓,不管從輿論角度,還是内部組織角度,這對網易都是一場級别極高的事故。
官方賬号很快回應是基礎設施出了故障;晚上 9 點,網易雲音樂又補充稱,是因爲 " 業務擴容 " 出現的技術事故。
無論是 " 基礎設施 " 還是 " 業務擴容 ",這些解釋普通人幾乎都很難看懂。
流言開始以大家能理解的方式口口相傳,版本不一,但背後的叙事邏輯無外乎 " 裁員裁到大動脈 ",程序員離職報複導緻的問題——這是大家喜聞樂見的爽文模式。
網易很快辟謠,稱 " 沒有删庫、沒有跑路 "。
截至發稿,網易集團沒有對外釋放更詳細的解釋公告;但根據目前兩個公開解釋,結合網易雲音樂近期的技術動作,背後的原因也幾乎浮現出來。
答案其實還是 " 省錢 "。
但這個 " 省 " 并不一定直接指向裁員。而是指網易在技術基建、方案上的省錢;也指網易這家公司在創始人就是唯一決策人的文化基因下,一直貫徹的省錢禀賦。
01
一位大公司的技術人員告訴我們,所謂 " 業務擴容 ",是公司爲了應對更多用戶或者更大規模的使用需求,在技術上增加或升級服務能力。這是一個相對常規的動作,是一家公司在正常運維過程中需要保障的東西。
簡而言之," 業務擴容 " 對一家技術合格的公司幾乎不可能會造成如此嚴重的問題。
網易集團是目前中國互聯網市值前五的上市公司,雲音樂也是一家年收入已經達到 20 億的上市公司,這意味着,正常 " 業務擴容 " 不太可能、也不應該出現這樣級别的事故。
網易此次的特殊性在于,它剛剛完成了從杭州到貴州數據中心的遷移。
7 月 11 日,網易雲音樂技術團隊在程序員社區 " 稀土掘金 " 以及自己的公衆号都發布了一篇名爲《雲音樂貴州機房遷移總體方案回顧》(後續簡稱《遷移方案》)的文章。
通過文章,我們可以看出雲音樂整體遷移至貴州機房是一個巨大的系統工程,規模大、難點多、風險大。
上述大公司技術人員向我解釋,像貴州機房這種規模的遷移即便完成也可能有很大潛在問題,因爲它會讓整體穩定性和保障性降低。在這樣的設施基礎上,一次簡單的 " 業務擴容 " 就可能讓問題大爆發。
換句話說,雖然網易雲音樂宕機可能并不發生在遷移過程中,但因爲換到了貴州機房,網易很多應用的穩定性至少在短時間内會變得更加脆弱。
既然一次大規模遷移可能帶來多次不可預知的問題——不到半年前的 3 月,網易雲音樂也出現過短暫宕機——那爲什麽一定要遷到貴州?
地理要素是其一,比如貴州一年四季氣候涼爽宜人,其喀斯特地貌和洞穴可以爲服務器更好降溫;而且貴州遠離地震帶,是很安全的數據儲存庫。
但對企業來說,更重要的決策原因可能還要回到我們一開始就已經提到的答案:省錢。
根據 China Daily 的報道,與在東南部沿海地區建立同樣的數據中心相比,在貴州可以節省大約 58% 的電費。1 萬個标準服務器機架,每年光電費就可以節省 1.3 億元。更别提貴州作爲大數據産業先行區,提供的政策支持和稅收優惠了。
這與想降本增效的大公司一拍即合。
2021 年到 2022 年,騰訊是對 " 降本增效 " 最明确的公司,它也是第一個在貴州建立數據中心的大公司。到 2022 年 9 月,網易貴安數據中心項目也正式簽約,項目規劃的标準機架就是 1 萬架。
這意味着,這個項目落地後,網易未來在數據中心的花費上,僅電費就可以節省 1.3 億元。
02
省錢換更好的地方無可指摘。但對網易來說,宕機事故的爆發,再往深追溯,其實是另一個問題——技術基建的薄弱。
大規模的數據遷移以及後續的保障是考驗一家公司技術底子的時候。在《遷移方案》中,網易技術團隊就列出了一系列技術債務;遷移完成後,也反思還存在應用元信息(即 " 信息标簽 ")建設不足、應用配置等多個問題。
保障性和穩定性也依然存在漏洞,網易技術團隊自己總結:
" 盡管在貴州機房遷移中,做了大量的穩定性保障措施,但依賴每個研發對各自負責領域的理解、運維能力。是否能在團隊管理、設施管理、服務管理、穩定性管理、架構設計等多方面,探索出一套可持續的長效保障機制?并進行一定的穩定性系統化建設?從而避免點狀問題随機發生。"
這個問題暫時無人可以回答,或許在這次事故出現後的複盤裏,技術團隊可以重提。
不過一家企業技術基建、技術團隊管理的問題,歸根究底也是它的文化和組織優先級的問題。
一位網易前員工告訴我們,網易并不是個追求技術先進的公司;技術架構可能一開始還行,但後來會因爲工期問題,隻能繼續往上堆垃圾。
另一位從網易跳槽到阿裏的員工,對比兩家公司的技術基建,也覺得網易在技術投入上過于看重投入産出比,一旦看不到效果就收縮,難有動力長期投入。
網易對技術人才的重視度從招聘上也能看出。不僅平均薪資低于其他大廠,崗位也更少。
一位今年畢業的技術崗位應屆生告訴我,在他們理想公司的排序裏,字節是首選;阿裏和騰訊是優選;快手對新技術很看重,面試體驗不錯;而京東和網易崗位不多,在校招生中存在感不強。
相比追求技術進步,網易是一家産品文化驅動的公司。這也跟創始人的志趣相關。
創業前兩年,網易創始人丁磊還在擔任網易的聯席首席技術執行官;到 2005 年底,他仍是網易的首席架構師。此後,你能看到,他的興趣就從技術轉移到了産品,他在逐漸成爲網易的 " 頭号産品經理 "。
對丁磊來說,産品經理的含義非常廣闊。互聯網應用、實體商品、遊戲,他的好奇心強烈,新點子也源源不斷;而這些新點子可以在網易這個王國裏完全地被滿足、被試驗。
遊戲賺錢、環境很好的時候,杭州研究院幾乎就是丁磊個人興趣的實驗室。這裏孵化了多個業務,雲音樂、雲課堂都是從這裏出生,他們獨立、壯大,有的甚至上市。
丁磊得到的正反饋越多,就越發肯定自己,他有時對産品經理們說," 我覺得自己的産品能力越來越強了。"
在網易,普通員工與丁磊打交道最多的一類也是産品經理。有員工看到,在丁磊的眼裏,技術員工隻會跟他說能不能實現,設計的作用是具象化,跟他們讨論都不過瘾,隻有産品經理能接住他的理念。
和其他已經實現了更現代化治理的公司相比,網易仍是一家創始人介入深、說了算的公司。這意味着,對技術投入程度基本取決于老闆的心态。
年景好的時候,網易也有資金投在數據中台、雲服務的建設上,但這個錢不好掙,也沒有創造一個産品來得開心和有成就感。年景不好的時候,這都是需要被收縮和優化的項目。
網易員工私下談論起丁磊,形容他仍是個 " 甯波小老闆 "。
一位網易前員工看到,5000 元的項目,管理層都得拿着單子親自找丁磊簽字,也得提前準備好答案以防丁老闆問起細節。
這種生意人的特點,可以解釋丁磊爲什麽從不投資網易的離職創業者。他在跟吳曉波的一次對談中,說隻相信自己的 " 商業模式 ",隻做自己懂、或者感興趣的事情。
創始人的禀賦讓網易在大環境開始變化時,提前就開始應對。2018 年後,丁磊就已經陸續開始對 " 興趣項目 " 進行盤點,2022 年,整個互聯網行業都在省錢,而網易趕在寒流到來之前就完成了大部分的 " 降本增效 "。
回到技術基礎設施建設的問題,一位員工抛出自己的觀點:" 你如果是一個‘鄉鎮企業家’,會重點投入在生産線升級換代上嗎?"