氣候變化給全球數據中心帶來了新的挑戰,也暴露出新的安全漏洞。溫度破記錄的熱浪使冷卻系統不堪重負,導緻服務器過熱,進而緻使全球許多熱門網站和應用紛紛崩潰。
攻擊者想利用過熱做手腳
一些公司在權衡是否将數據中心的溫度稍調高一點,以此來降低能源成本,确保可持續性是擺脫能源成本急劇上升的途徑。
攻擊者的目标是通過攻擊冷卻系統,對過熱做手腳,從而從數據中心竊取價值數十億美元的數據。從網絡犯罪團夥到複雜的高級持續性威脅(APT)攻擊團隊,許多由政府資助的組織都期望發動更多的數據中心攻擊,而過熱正是攻擊者手裏的武器。
切莫因數據中心過熱而靠近網絡安全風險
對于許多公司來說,數據中心的成本持續攀升至創紀錄的水平,其中能源成本超過了所有其他類别的支出,盡可能提高冷卻效率對數據中心的盈利能力至關重要。冷卻大約占數據中心總能耗的 40%。雖然數據中心從改進冷卻方法入手,逐步實現可持續性,在提高能源效率方面繼續取得長足進步,但許多數據中心忽視了自己在可持續性方面能走得多遠,從而帶來了更大的網絡安全風險。
據麥肯錫聲稱:" 數據中心是能耗大戶——超大規模計算公司的數據中心的用電量相當于 8 萬戶家庭的用電量。因此,數據中心在确保可持續發展方面面臨很大的壓力,一些監管機構和政府(包括新加坡和荷蘭)正在對新建的數據中心實施可持續發展标準。"
盡管投入到确保可持續發展方面的資本達到了創記錄的數額,但數據中心依然出現了服務器因過熱而容易出現故障、從而導緻中斷的一幕。雖然新的冷卻技術(包括室外空氣冷卻)具有成本效益,但同時它們給數據中心基礎設施帶來了污染物,這種污染物可能會損壞硬件。
數據中心降低冷卻成本的另一種方法是提高服務器入口溫度。衆所周知,在數據中心,服務器是導緻故障的最主要原因,因而爲了節約成本而任由溫度上升是有問題的。過熱引起的服務器故障會導緻意外停運,從而擾亂數據中心的正常運營,并可能導緻網站、應用和在線存儲出現不可預測的故障,從而造成數十億美元的生産力損失。
有媒體采訪了幾位數據中心恢複專家,他們證實,數據中心在削減開支以節省成本,許多數據中心都在努力将服務器入口溫度保持在 80 華氏度以下,這是服務器冷卻的共識标準。
成本節約比降低網絡安全風險更重要。
2022 年推特(Twitter)的薩克拉門托數據中心因極端高溫天氣而宕機就是一個先例,表明了将來極端高溫确實會影響服務器的性能。推特工程副總裁 Carrie Fernandez 在寫給工程師的内部備忘錄中寫道:"9 月 5 日,由于極端天氣,推特的薩克拉門托(SMF)數據中心區域停運。這起史無前例的事件導緻該數據中心的物理設備完全關閉。"
推特的中斷由于極端熱浪造成,網絡攻擊者也注意到了這起故障及其他極端高溫引發的故障,進而調整其攻擊手法,以攻擊暖通空調、電力和冗餘電源系統。
利用過熱的數據中心進行攻擊
攻擊者不斷調整攻擊手法,并編寫惡意軟件以攻擊冷卻系統,從而迫使數據中心崩潰,以收到勒索贖金或者發表政治聲明。
佐治亞州亞特蘭大的一個數據中心在 2018 年遭到了網絡攻擊,導緻多項城市服務關閉,包括市法院、警察局和亞特蘭大哈茨菲爾德機場。網絡攻擊者使用 SamSam 勒索軟件的變體,旨在加密每一台可用服務器上的數據。攻擊者還滲入了數據中心的冷卻系統,導緻溫度升高至 100 華氏度以上,損壞了服務器 CPU 和相關的芯片設備。
最後,網絡攻擊者索要了價值 51000 美元的比特币,以解鎖服務器并交還冷卻系統的控制權。
兼顧安全性和可持續性
數據中心面臨着不斷擴充存儲容量、縮短訪問延遲、控制成本以及尋找新方法來抵禦網絡攻擊的挑戰。雪上加霜的是,數據中心又面臨減少環境影響和能源消耗的壓力,因爲數據中心約占全球用電總量的 1%,約占全球溫室氣體排放量的 0.3%。數據中心運營商正在制定創新的新戰略,以實現這些具有挑戰性的目标,包括更加依賴可再生能源、節水冷卻系統和廢熱回收技術來提高可持續性。
以下策略給實施這些項目的數據中心擁有者和恢複專家帶來了好處:
•養成制作詳細熱圖的習慣,以識别熱點和優化冷卻。
數據中心恢複專家表示,這是許多數據中心運營商面臨的一個盲點,他們沒有養成定期制作熱圖的習慣。考慮到服務器在極端溫度下性能會迅速降級,因此将此任務作爲任何數據中心的肌肉記憶的一部分是好主意。
•考慮人工智能如何有助于改善耗電,并輔以環保型冷卻器和蒸發冷卻。
據有關專家和數據中心運營商聲稱,人工智能給數據中心帶來的好處逐漸顯現。有人認爲,人工智能優化對于成功達到内部和監管标準基準所需的可持續性基準至關重要。爲了避免超過服務器入口溫度,更多的數據中心也在使用人工智能來實時解釋并觸發警報和操作,動态調整以防止過熱,同時最大限度地提高效率。
•具有容錯電源的冗餘冷卻系統是數據中心冷卻的未來。
熱浪和數據中心故障在歐美越來越常見,以及去年夏天發生在倫敦的重大故障,這些都表明了數據中心必須應對一種全新的高溫挑戰。
•使用人工智能優化數據中心資産清單日益受到追捧。
對于人工智能和機器學習算法來說,這是完美的用例,可以訓練這些算法,以優化硬件和系統配置,從而應對數據中心正常運行需要遵守的一系列日益複雜的約束條件。使用基于人工智能的優化技術可以考慮服務器 CPU 的可持續性要求、資源負載和冷卻要求,緻力于爲數據中心在最優性能狀态下運行創造最佳的環境條件。
數據中心在競相提高網絡安全性和可持續性
數據中心行業正努力減小其環境足迹,爲此它必須兼顧可持續性和網絡彈性目标。比如說,室外空氣冷卻等可持續解決方案可以節省能源,但如果不作爲一項更廣泛的數據中心網絡安全計劃的一部分加以管理,可能導緻安全風險激增。
在競相提高數據中心可持續性的态勢下,運維團隊和運營數據中心的公司是時候擁抱可持續性了!