本期會議邀請到來自哔哩哔哩、美圖公司、享道出行等在穩定性工程領域有着良好實踐的技術專家,一起深入探讨在雲原生、智能時代面對複雜應用系統,如何借助穩定性工程來提升系統服務的穩定性等,讨論運維标準化工程和穩定性運營實踐、SRE 轉型實踐與可靠性工程實踐。以标準化工程實踐預防問題,防患未然、化解隐患,更好地提前發現潛在風險,盡量減少故障的發生,降低業務風險。8 月 3 日,歡迎報名!
TF115 SRE 自動化工程實踐和穩定性運營
爲工程師提供頂級交流平台
CCF TF 第 115 期
時間:2023 年 8 月 3 日 19:00-21:00
(線上會議)
主題:SRE 自動化工程實踐和穩定性運營
歡迎掃碼了解詳情,報名線上參會
報名鏈接:https://conf.ccf.org.cn/TF115
在數字化時代,數字化業務迅速發展,随之軟件的規模擴展很快,軟件系統的複雜性快速增長,即使采用微服務架構、雲原生平台,複雜性問題沒有得到顯著改善,生産環境的穩定性面臨着巨大的挑戰,從而産生了軟件工程的一個新分支:穩定性工程。
系統穩定性工程(Site Reliability Engineering,SRE)是一種緻力于确保系統穩定性和可靠性的跨職能工程實踐。它結合了軟件工程和運維運營的最佳實踐,旨在提供高效的運維支持,确保系統在面對高負載、故障和變更時仍能保持穩定運行。
SRE 的作用是通過自動化運維流程、監控系統、故障預測和快速響應來降低系統故障率,并通過持續改進來提高系統的可靠性。SRE 團隊與開發團隊緊密合作,共同負責系統的設計、部署、運維和監控,以确保系統能夠滿足業務需求并提供優質的用戶體驗。
運維在系統穩定性工程中發揮着重要作用。運維團隊負責監控系統的運行狀況、處理故障和變更管理。他們通過實時監控和日志分析來發現潛在問題,并采取相應措施來防止故障的發生。運維團隊還負責制定和執行災難恢複計劃,以确保系統在面臨災難性故障時能夠快速恢複。
穩定性運營是系統穩定性工程的核心概念之一。它強調通過系統化的方法來管理和改善系統的穩定性。穩定性運營包括建立監控系統、設置警報、制定故障恢複策略以及進行容量規劃等活動。通過穩定性運營,可以提前預測和防止潛在的故障,并及時采取措施來保障系統的穩定性。
在系統穩定性工程中,有一些優秀實踐可以幫助團隊提高系統的穩定性。本期會議邀請到來自哔哩哔哩、美圖公司、享道出行等在穩定性工程領域有着良好實踐的技術專家,一起深入探讨在雲原生、智能時代面對複雜應用系統,如何借助穩定性工程來提升系統服務的穩定性等,讨論運維标準化工程和穩定性運營實踐、SRE 轉型實踐與可靠性工程實踐。
在這次會議中,您會有不少收獲:
- 如何建立良好的流程來減少人爲錯誤和提高效率?
- 開發怎樣的運維自動化工具或平台來保證系統的可靠性?
- 需要哪些團隊提供怎樣的支持?
- 如何從被動方式轉化爲主動方式?
- 如何進行穩定性運營?
......
總之,系統穩定性工程是确保系統穩定運行的關鍵實踐。通過 SRE 團隊的努力,結合運維的作用、穩定性運營和優秀實踐,可以提高系統的可靠性和用戶滿意度。在不斷變化的技術環境中,系統穩定性工程是保障業務連續性和用戶體驗的重要保證。
歡迎報名,并參與我們的互動。
會議安排
TF115:SRE 自動化工程實踐和穩定性運營 主持人:朱少民 CCF TF 軟件質量工程 SIG 主席,同濟大學特聘教授 | ||
時間 | 主題 | 講者 |
19:00-19:10 | 活動介紹及緻辭 | 朱少民 CCF TF 軟件質量工程 SIG 主席,同濟大學特聘教授 |
19:10-19:40 | 《運維标準化工程實踐》 | 謝慶芳 享道出行運維自動化負責人 |
19:40-20:10 | 《B 站 SRE 轉型實踐與可靠性工程實踐》 | 武安闖 哔哩哔哩 SRE 負責人 |
20:10-20:40 | 《美圖 SRE 團隊的「穩定性運營」實踐》 | 石鵬 美圖公司高級運維經理 |
20:40-20:55 | 參會者提問互動 | 朱少民、謝慶芳、武安闖、石鵬 |
20:55-21:00 | 活動總結 | CCF TF 軟件質量工程 SIG 主席,同濟大學特聘教授 |
CCF TF 軟件質量工程SIG
特邀講者
謝慶芳享道出行運維自動化負責人
主題:《運維标準化工程實踐》
主題簡介:随着公司規模不斷壯大,業務量也飛速增長,生産環境穩定性面臨更大的挑戰,其中運維穩定性是基礎也是保障。每一次運維變更都會加大故障率,最終影響用戶滿意度。運維變更治理不光要追求穩,還要追求快。對于穩,需要流程化;對于快,需要自動化。變更流程單靠口頭表述、文檔制定或單純的記憶,稱不上流程化。腳本隻是本地維護,人工調用,稱不上自動化。一旦有變更,很難同步對齊,就需要工具來承載,實現真正意義上的标準化。工具平台的建設 + 腳本的統一維護是解決變更混亂的有效方法,不僅能避免出錯,還可以高效處理。表面看有益運維,實質是業務價值最大化回饋用戶。
個人簡介:負責享道出行一體化平台建設,偏 SRE 方向;曾有基礎架構中間件、性能、自動化等經驗;QECon 技術講師;GOPS 線下沙龍講師;享道出行線上品牌主播。
武安闖哔哩哔哩 SRE 負責人
主題:《B 站 SRE 轉型實踐與可靠性工程實踐》
主題簡介:傳統運維已無法滿足現階段互聯網分布式架構下的可靠性保障,SRE 就是終極破局之法嗎?SRE 該如何轉型,轉型中需要哪些支持,轉型後的可靠性工程如何實踐?本次分享就這些問題給大家帶來 B 站 SRE 的思考、探索與實踐,深度介紹我們的可靠性工程框架。
本次演講提綱如下:
1、傳統運維與 Google SRE 的演進與區别;
2、人、組織、制度爲 SRE 轉型保駕護航;
3、SRE 轉型後如何開展可靠性工程;
4、可靠性工程框架與實戰。
聽衆可從本次分享中收獲到:
1、了解運維轉型 SRE 中遇到的困難和如何破局;
2、SRE 可靠性工程在互聯網公司的實際框架;
3、了解 SRE 如何解構與落地可靠性工程。
個人簡介:對 SRE 高可用架構、技術風險體系建設、質量運營和組織轉型有深刻的建設實踐和思考;主導 B 站 SRE 轉型、高可用架構、故障快恢、SLO 工程、容量管理體系、多活容災等專項;從 0 到 1 帶領 B 站運維向 SRE 轉型,建設 B 站可靠性體系;當前專注 SRE 可靠性體系規劃建設和落地實踐。
石鵬 ( 東方德勝 )
美圖公司高級運維經理
主題:《美圖 SRE 團隊的「穩定性運營」實踐》
主題簡介:随着外部環境、行業變革、雲原生等技術的不斷深化,傳統的 " 被動響應式 " 的運維方法面臨諸多挑戰,在很多場景下已經無法滿足企業需求。我們迫切地需要轉變思路,從 " 被動響應 " 轉爲 " 主動出擊 ",将更多的工作内容前置、左移,防患于未然、化風險于無形。同時還需要用更科學的宏觀框架來系統地梳理和規劃運維工作,并做好各職責目标之間的動态平衡,以此更好地掌控 "SRE 基本盤 "。在此背景之下,美圖 SRE 團隊探索了一條攻守兼備的「穩定性運營」之路,做了一些方法的歸納和總結,希望給大家帶來一些啓發。
拟定大綱:
01 SRE 的目标 & 挑戰;
02 指導破局的理論框架;
03「守」穩住基本盤;
04「攻」規劃 & 運營。
個人簡介:石鵬 ( 東方德勝 ) ,2016 年加入美圖,運維技術專家,美圖産品 SRE 負責人。目前在美圖負責社區、商業化、創新、實驗室等全線産品的運維保障工作,同時參與公司部分工具平台和基礎設施的建設。多次參與或主導過公司基礎設施的調整、遷移或改造,在監控、災備、故障管理、穩定性運營等方面有一定的經驗和積累。業界多個技術大會的分享嘉賓、金牌講師或出品人。
SIG 主席 & 會議主席
朱少民CCF TF 軟件質量工程 SIG 主席,同濟大學特聘教授
個人簡介:近三十年來一直從事軟件測試、質量管理等工作,先後獲得多項省、部級科技進步獎,已出版了二十多部著作和 4 本譯作,代表作主要有《軟件質量保證與管理》、《軟件測試方法和技術》、《全程軟件測試》等,并經常在國内外學術會議或技術大會上發表演講,曾任思科(中國)軟件有限公司 QA 高級總監、IEEE ICST 2019 工業論壇主席、IEEE ICST、QRS 和 DSA、NASAC 程序委員、《軟件學報》審稿人等。
參會說明
1、如報名後無法參加,請及時于活動開始前發送郵件申請取消(聯系郵箱:[email protected]),無故缺席将影響下一期活動的參與。
3、會議鏈接和密碼将在活動當天通過郵件、短信通知。可點擊騰訊會議鏈接,輸入密碼參加。
4、請于活動前一天 12:00前完成報名,及時獲取會議鏈接。
5、CCF 會員免費參加,非會員 99 元 / 次,加入會員可免費參與全年 20 場線上活動。
智能設備與交互 SIG 活動預告,歡迎關注并參與:
TF123 | 11 月 2 日 | 軟件質量工程 SIG | 用戶體驗工程 |
會員權益
會員免費參加 CCF TF 全年 20 場線上活動,優惠價參加 14 場線下活動,爲自己的技術成長做一次好投資,用高性價比獲取專業知識的絕佳路徑!
專業會員 / 高級會員 / 傑出會員 / 會士:360 元 / 年
學生會員:50 元 / 年。
具體權益請點擊查看:CCF 個人會員權益
申請公司會員,可享受更多免費名額、品牌宣傳及其他權益,詳情點擊查看:CCF 公司會員權益或咨詢電話 0512-65900856 轉 27
長按識别或掃碼入會
報名方式
2023 年 8 月 3 日(周四) 19:00-21:00
長按識别或掃碼報名
報名鏈接:https://conf.ccf.org.cn/TF115
聯系方式合作單位
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~