半個多月前的世界互聯網大會上,有人用滴滴舉例:" 如果滴滴的服務器宕掉了,可能你出門就叫不到車了。" 沒想到,一語成谶。11 月 27 日," 滴滴崩了 " 相關話題上了熱搜,這天深夜,上海、北京、廣州多地滴滴用戶反饋,滴滴出行 App 無法使用,地圖無法加載,打不着車。直至 28 日下午,滴滴出行 App 才恢複正常。
滴滴系統故障導緻的宕機時間接近 12 小時,趕上一個 " 晚高峰 " 和一個 " 早高峰 ",由此也引發了不小的混亂。用戶端抱怨 " 叫車叫到崩潰 "" 全勤獎被扣 ";司機端也出現無法接單、計費混亂等問題。有媒體估算,滴滴系統崩潰的近 12 小時,損失的交易額或将過億元,損失訂單量約千萬單。
滴滴出行在 28 日啓動了複盤調查,公布了事故的起因。雖然起因是底層系統軟件發生故障,并非是網傳的 " 遭受攻擊 ",但無論是哪一個原因,均暴露出滴滴出行在服務器軟環境的安全管理漏洞。這不是滴滴系統第一次發生服務故障。再加上近期阿裏雲崩潰,導緻阿裏巴巴旗下諸多應用宕機,這二者的疊加,引發公衆對于 " 互聯網基礎設施 " 安全性的讨論。
對占網約車市場七成份額的滴滴出行來說,其存在的實際意義已經相當于基礎設施,隻不過此類基礎設施并非在線下而是在線上。互聯網基礎設施如同日常生活中的燃氣、水電等線下基礎設施一樣,其運營的安全性需受到同樣的重視。不能總等到一個主流互聯網應用程序宕機了,影響了大量用戶的衣食住行了,給企業造成了不可估量的損失了,才想起做技術風險排查工作。
早在 2015 年也出現過同類由宕機引發的安全事故。由于員工錯誤操作引發斷電,攜程平台癱瘓近 12 個小時,網頁版和手機 App 均不能正常使用,導緻大量用戶無法按照預定計劃正常出行。這次事故促使了互聯網企業硬件安全管理意識的提升。随着互聯網的蓬勃發展,如今,不少互聯網應用已經進入成熟發展期,硬件安全意識早已不成問題,但卻在服務器軟環境的安全管理上仍不免差錯。
當然,對于提供服務的互聯網公司來說,在安全問題上法律有明确的要求。《網絡安全法》要求,建設、運營網絡或者通過網絡提供服務,應當依照法律、行政法規的規定和國家标準的強制性要求,采取技術措施和其他必要措施,保障網絡安全、穩定運行,有效應對網絡安全事件。
法律雖然有明确要求,執行上卻需要企業做出更多探索。保障互聯網基礎設施的安全運營不僅需要管理者對運營工作的正确理解,也需要技術的支撐。技術需要大量的資金投入作爲支撐,才能實現技術更叠,進而保障産品穩健運行和用戶體驗的上升。在互聯網企業 " 降本增效 " 的背景下,如何不影響系統運行的穩定性,是每個互聯網企業都需要面對和解決的問題。
互聯網企業還是要補上 " 安全意識 " 這塊短闆,對于那些在實際意義上已經成爲互聯網基礎設施的應用程序來說,絕不能再讓 " 系統宕機 " 影響用戶體驗了。面對公衆的疑慮,各個互聯網企業需要對企業安全管理更加重視,也需要企業内部組織管理架構适配當下的互聯網企業運營方式。
無論如何,此次滴滴宕機事件應該引發其他互聯網公司以及通訊服務企業的警覺,要評估服務器軟環境運行的安全性,及時開展技術風險排查工作,全面保障服務的穩定性,并且要準備相應的應急處理方式,盡最大努力避免類似的事故再次發生。