2022 年 10 月 27 日,經曆了長達半年的拉鋸戰之後,馬斯克終于将 Twitter(現已更名 X)收歸囊中,這筆 440 億美元的收購案也終于迎來了大結局。入主 Twitter 後,馬斯克進行了大刀闊斧的改革,如今一年過去了,Twitter 發生了哪些變化?
2023 年 10 月 27 日,X 工程技術發布帖子稱,過去一年是 X(Twitter)平台全面推進工程技術探索的一年。除了大家在 X 應用端看到的直觀調整之外,團隊還在幕後完成了以下一系列重要改進。其中包括:
關閉薩克拉門托數據中心,并重新配置了 5200 台機架和 14.8 萬台服務器,每年節約超 1 億美元。共釋放出 48 兆瓦的功率配額、拆除重達 6 萬磅的網絡梯架,必要設備後續将被重新配置至其他數據中心。
優化了 X 的雲服務使用方式,着手将更多工作負載遷往本地基礎設施。這一轉變使 X 每月的雲成本降低了 60%。所有媒體 /blob 工作均已下雲,這讓 X 的整體雲數據存儲量縮減了 60%,還成功将雲數據處理成本降低了 75%。
此外,X 還發生了以下變化:
圍繞單一産品框架整合了 For you(爲您推薦)、Following(關注)、Search(搜索)、Profiles(個人資料)、Lists(列表)、Communities(社區)和 Explore(探索)等技術棧。
從頭開始全面重建了 For you 服務與排名系統,代碼行數從 700K 縮減至 70K,精簡比例高達 90%,計算占用量降低 50%,根據請求得分計算的帖子吞吐量增長了 80%。
統一了 For you 和視頻個性化及排名模型,顯著提高了視頻推薦的質量。
重構了技術棧内的 API 中間件層,通過删除超過 10 萬行代碼和數千個未實際使用的内部端點、清理未采用的客戶端服務等方式完成了架構簡化。
精簡後的元數據獲取延遲降低了 50%,全局 API 超時錯誤減少了 90%。
阻斷 bot 和内容抓取的速度較 2022 年提高了 37%。平均而言,X 每天阻斷超 100 萬次 bot 注冊攻擊,并将直接垃圾郵件減少了 95%。
構建本地 GPU 超級計算集群,并設計、開發和交付了 43.2 Tbps 的新網絡體系架構以支持這些集群。
擴展網絡主幹容量與冗餘,每年節約 1390 萬美元。
開始進行自動峰值流量故障轉移測試,用以持續驗證整個平台的可擴展性與可用性。
自接手 X 以來,馬斯克爲了縮減成本挖空心思,其中包括裁員、推行 " 極端硬核 " 企業文化、拖欠辦公室租金 …… 在公司的運營開支方面,馬斯克去年剛接手 X 時便指示團隊通過削減雲服務和額外的服務器空間,力争每天在基礎設施上節省 300 萬美元。
省錢大法一:雲服務太貴了,馬斯克要 " 下雲 "
2020 年 12 月,Twitter 宣布将使用亞馬遜雲科技爲其主時間線提供支持。當時的消息稱這将是一份 " 多年期 " 協議,但沒有透露任何具體數字。彼時 Twittr 公司 CTO Parwal Agrawal 在一份聲明中表示,Twitter 和亞馬遜雲科技将合作擴展該社交媒體的基礎設施、加快功能發布速度,并擴大其功能組合。
據 The Information 2023 年 3 月報道,這筆交易爲期五年半,合同總值 5.1 億美元。根據報道,無論是否使用相應容量,Twitter 都同意向亞馬遜雲科技付費。而且亞馬遜雲科技不願就具體條款進行重新談判。根據交易細則,Twitter 的月度亞馬遜雲科技支出大約在 773 萬美元。
如今,Twitter 已經不再使用亞馬遜雲科技的實時時間線功能,轉而選擇了 AWS for Spaces 等其他服務。Twitter 後續可能使用 Google Cloud Platform(GCP)運行其時間線業務。根據 Twitter 與亞馬遜雲科技之間簽訂的合同細節,馬斯克執掌的社交媒體巨頭還計劃使用:
亞馬遜雲科技雲基礎設施,用于補充 Twitter 的本地功能,幫助該公司在全球範圍内擴展其實時服務。
采用 Amazon Elastic Compute Cloud(Amazon EC2)服務中基于 Arm 架構的亞馬遜雲科技 Graviton 2 實例,以運行其雲工作負載。
借助亞馬遜雲科技容器服務,Twitter 将在其混合基礎設施當中統一構建并交付新的功能和服務。
Amazon CloudFront,即亞馬遜雲科技的超高速内容交付網絡(CDN)服務,能夠以低延遲、高速率向全球客戶分發數據、應用程序、視頻和 API。
Amazon DynamoDB,即亞馬遜雲科技的鍵值數據庫,可大規模提供個位數毫秒級性能。
目前,Twitter 已經與谷歌簽訂了一份價值 10 億美元的合同,且相關承諾早在與亞馬遜雲科技合作之前就已敲定。另據報道,Twitter 将在 2023 年向谷歌支付總計 3 億美元,這也是總價值約 10 億美元的多年期合作協議的一部分。
随着馬斯克入主 Twitter 并開啓削減成本計劃,Twitter 的基礎設施支出大幅減少。根據題爲 " 深度削減成本 " 的 Slack 内部消息,Twitter 計劃從雲服務和服務器容量方面入手,省下 150 萬到 300 萬美元。此外,Twitter 還試圖與亞馬遜雲科技、Google Cloud 以及甲骨文就合同内容展開重新談判,但供應商們紛紛表示拒絕。
根據最新公告,馬斯克通過将工作從雲端轉移到 Twitter 自己的服務器上,每月的雲成本降低了 60%,整體雲數據存儲量縮減了 60%,還成功将雲數據處理成本降低了 75%。
下雲就能解決問題?
近年來,爲了節省成本,不少公司開始下雲。不過,并非所有公司都适合下雲,需要結合自身實際業務情況來做判斷。比如,GitLab 在 2016 年底的時候就表示計劃要 " 下雲 ",不過團隊 " 在收到數百條充滿建議和警告的評論和郵件後,最後還是決定将 GitLab.com 保留在雲端 "。
此外,37signals 旗下一款流行的基于雲服務的項目管理軟件 Basecamp 也曾想 " 下雲 "。Basecamp 的上雲曆程已經超過十年,而且其前兩年發布的産品 HEY 也一直在雲端運行。但 Basecamp & HEY 聯合創始人 David Heinemeier Hansson 發文表示将要 " 下雲 "。
" 我們用過亞馬遜雲科技、也用過谷歌雲,試過裸虛拟機、也體驗了 Kubernetes 容器編排。我們知道雲能提供哪些功能,其中大部分都有實際應用。現在我們終于得出結論:對于像我們這樣一家增長穩定的中型企業來說,租賃基礎設施資源總體上看是筆糟糕的買賣。雲服務商做出的降低複雜性、控制運營成本等承諾從來就沒能實現,所以我們正在籌劃脫離雲端、重歸本地。"
不過,在 David Heinemeier Hansson 撰寫的關于離開雲計算的思考中,他特别提到了兩個情況是不能離開雲計算的。一種是流量極低,一種是複雜不均衡:
第一個極端是當您的應用程序非常簡單且流量很低,通過使用完全托管的服務來降低複雜性确實能夠節省成本。這是 Heroku 鋪就的道路,也是 Render 等其他服務商所追随的道路。當您沒有客戶時,這是一個絕佳的起點,即使在您開始擁有一些客戶後,它仍能推動您的業務發展。(然後,一旦使用量激增,賬單飙升到天際線上時,您可能會面臨一個好問題,但這是一個合理的權衡。)
第二個極端是當您的負載非常不規則時。當您的使用量出現劇烈波動或巨大峰值時。當基線隻是您最大需求的一小部分時。或者當您不知道您需要十台服務器還是一百台時。在這種情況下,沒有什麽比雲端更好了,就像我們在推出 HEY 時學到的那樣,突然有 30 萬用戶在三周内注冊嘗試我們的服務,而我們的預測是六個月内有 3 萬用戶。
省錢大法二:數據中心大遷移
爲了節省成本,去年 12 月,馬斯克還關閉 Twitter 加州數據中心。
據悉,在平安夜前夕,馬斯克飛往加利福尼亞州的薩克拉門托—— Twitter 三大主要計算存儲設施之一的所在地——切斷了維持該社交網絡平穩運行的服務器。有知情人士表示,雖然有員工擔心關閉這些服務器可能導緻各種問題,但節省資金是首要任務。
随後,世界各地的用戶報告 Twitter 服務中斷。一些用戶反饋 Twitter 出現很多奇怪的錯誤消息,比如看到空白頁面、無法回複推文或關注熱門話題,還有人被迫退出登錄。有熟悉 Twitter 基礎設施的人士表示,如果薩克拉門托的設施仍在運行,它就可以在其他數據中心出現故障時提供備份計算能力,從而幫助緩解問題。
此外有消息稱,當時馬斯克爲了省錢,計劃将薩克拉門托的服務器搬到波特蘭,基礎設施團隊稱這項工作至少要九個月才能完成,馬斯克一怒之下直接搭乘私人飛機跑去機房,拔了網路線與電源就搬上大卡車開始轉移,最後整個工作一個月就完成了。
在今年 9 月出版的《埃隆 · 馬斯克傳》中,詳細講述了馬斯克親自遷移服務器的故事(節選,經編輯):
2022 年 12 月 22 日深夜,位于 X 公司 10 樓的會議室,馬斯克正在與兩名基礎設施經理進行緊張的交談。
位于薩克拉門托的一家數據服務公司允許 X 公司延長其服務器租約,以便在 2023 年有序遷出。一名顯得有些緊張的基礎設施經理告訴馬斯克:" 今天早上,他們回來告訴我們說這個計劃不再适用,因爲他們認爲我們在财務上不再穩健。"
這個設施每年花費 X 公司超過 1 億美元。馬斯克想通過将服務器遷移到 X 公司在俄勒岡州波特蘭的其他設施來節省這筆費用。另一位經理表示這項工作不能立即進行。她平靜地說:" 我們至少需要六到九個月的時間,因爲薩克拉門托仍然需要服務流量。"
馬斯克沉默了幾秒鍾,然後宣布:" 你們有 90 天時間來完成這項任務。如果你們做不到,你們可以辭職。" 這名經理開始詳細解釋遷移服務器到波特蘭的障礙。" 機架密度不同,電力密度也不同," 她說。" 所以機房需要進行升級。" 她開始詳細介紹更多原因,但被馬斯克打斷。" 這讓我的大腦感到壓抑," 馬斯克說道," 你知道腦袋爆炸的表情符号嗎?我的腦袋現在就是這個感覺。真是一堆屁話。波特蘭明顯有大量的空間,從一個地方遷移到另一個地方簡直小菜一碟。"
" 你們需要做的就是将服務器遷移到波特蘭," 馬斯克說道," 如果超過 30 天,我會很震驚。" 他停頓了一下,重新計算。" 找一家搬家公司,運輸電腦需要一個星期,然後再花一個星期來連接它們。兩周。就應該這樣。"
所有人都默不作聲。但馬斯克仍在發火。" 如果你們租了一個 U-Haul (一家租車公司),你們可能自己就能完成。" 兩位 X 公司的經理看着他,試圖判斷他是否是認真的。馬斯克的兩位親密助手 Steve Davis 和 Omead Afshar 也在場。他們多次看到過他這樣,知道他可能真的這麽認爲。
12 月 23 日星期五晚上,James 和他的弟弟 Andrew(馬斯克的表弟)與馬斯克一起從舊金山飛往奧斯汀,當飛機飛過拉斯維加斯時,James 提出了一個建議,他們現在就可以移動服務器。一個名爲 Alex 的來自烏茲别克斯坦的 X 員工幫助他們進入了 X 公司的數據中心,内部共有大約 5200 個冰箱大小的機架,每個機架有 30 台電腦。每個機架重約 2500 磅,高 8 英尺。但馬斯克認爲 " 這些東西看起來并不難移動 ",他向保安借了一把小刀,擡起地闆上的一個通風口,這讓他可以撬開地闆面闆。然後他爬到服務器下面,用小刀撬開了一個電箱,拔掉了服務器插頭,等着看會發生什麽。沒什麽異常發生。服務器已經準備好遷移。
第二天——聖誕前夜,馬斯克召集了增援。Ross Nordeen,與他的朋友 James 在 Tesla 工作,從舊金山驅車而來。他在聯合廣場的 Apple Store 花了 2000 美元,買下了所有的 AirTags,這樣服務器在遷移過程中就可以被跟蹤。然後他去了家得寶,花了 2500 美元買了扳手、斷線鉗、頭燈和擰下地震螺栓所需的工具。
Steve Davis,馬斯克的忠誠副手,找人租了一輛半挂車,并安排了搬家車。其他來自 SpaceX 的援助隊員也已到達。這些服務器機架都有輪子,所以團隊能夠斷開其中四個并将它們推到待命的卡車上。這表明,這五千兩百多個服務器可能在幾天内全部移動。" 夥計們幹得好!" 馬斯克興高采烈地說。
到這周結束時,他們已經使用了薩克拉門托所有可用的卡車。盡管該地區受到了雨的襲擊,他們仍然在三天内移動了 700 多個機架。該設施之前的記錄是一個月移動 30 台。這仍然留下了大量的服務器在設施中,但這群人已經證明了它們可以被快速移動。其餘的部分在 1 月份由 X 公司的基礎設施團隊處理。
馬斯克的瘋狂舉動引發了不少争議。網友海狗油 90 認爲," 幾乎沒有人明白數據中心搬遷要搬的是服務、數據,而不是服務器本身,也不明白 X 這樣的公司,服務連續性、數據一緻性值多少錢。"
網友酷憋哥評論稱:" 除了證明馬斯克膽子大,這個案例沒有什麽正面的意義,試想一下,哪個普通打工人可以作出這麽魯莽的決定?他或她是否能承擔由這種行爲導緻的嚴重後果?所以最終隻有老闆能做這種事情,隻要他願意。"