36 氪獲悉,時序數據庫公司「Greptime」(格睿科技)于今日正式進行産品升級,将自身雲原生時序數據庫産品 GreptimeDB 進行分布式升級。公司表示,本次更新,我們開發的功能主要聚焦在分布式,相較之前的單機版本,分布式版本提供了更強大的擴展性、高可用性和容錯性等。
Greptime 是 36 氪報道過的一家公司。公司成立于 2022 年 4 月,目前的主要産品是時序數據庫 GreptimeDB 和格睿雲 GreptimeCloud。
其中,GreptimeDB 是一款用 Rust 寫的雲原生、分布式、融合時序和分析的開源時序數據庫。GreptimeCloud 則是基于 GreptimeDB 的 Database as a Service 雲服務。
據介紹,對用戶來講,GreptimeDB 的主要特點包括:
可用可靠的透明式、分布式:在滿足分布式的高可用高可靠之外,GreptimeDB 在使用體驗上做到透明,也就是使用者從單機模式到集群模式,可以無縫切換。
第二個特點是針對時序領域的優化:這裏包括了對于時序領域生态的協議兼容,方便快速接入,以及針對時序數據的壓縮和存儲方案優化,讓用戶不再擔憂曆史數據的存儲成本問題。
最後也是最重要的一個特點是融合負載。除了存算分離架構保障不同計算資源靈活擴縮容以外,GreptimeDB 還原生支持 SQL/Python 來做複雜的庫内計算,提升分析的實時性。
據介紹,作爲一個開源項目,GreptimeDB 現在已有 2700 多個 star,其中海外和國内的人數相當。
Greptime
談及本次更新,公司介紹,在 4 月中旬發布的 v0.2 版本中,Greptime 的主要目标集中在單機,PromQL 兼容,寫入性能優化等。而如今的 v0.3 版本,則主要聚焦在 " 分布式 "。
拆解開來,這次基于分布式的重點優化在以下幾個方向:
查詢能力提升:包括支持分布式查詢優化、重要 SQL 查詢的改善,如 TopK 場景的處理,增強 PromQL 的兼容性,以及優化數據壓縮策略來加快查詢速度。
穩定性增強:爲了增加系統的健壯性和可靠性,引入了 Procedure 框架。同時提供了更細粒度的 Hybrid-flush 策略以提高寫入的穩定性,并對可觀測性進行了提升,增加了更多性能指标度量的埋點,支持如 Tokio console 等工具。
分布式性能優化:實現了 Region 級别的高可用性,提供了快速的容災切換調度。同時也對分布式寫入性能進行了優化。
整體來說,公司表示 v0.3 會是一個初步可以試用的分布式版本。它具備了 region 粒度的服務高可用(數據高可靠還待後續版本完成),重點場景的分布式查詢(重點是 PromQL 查詢方向)和寫入性能均達到或者略微超過主流同類數據庫性能的水位線。
在此前的采訪中,Greptime 創始人莊曉丹曾告訴 36 氪,他認爲雖然市面上已經存在不少時序數據庫,但時序數據庫領域至少在三個方面還需要叠代:首先,在以雲原生的方式持續實時地解決海量時序數據的寫入、查詢的工作任務時,時序數據庫的能力還有待提升。第二,對時序數據的挖掘和利用,也就是分析需求,目前還未能被很好地解決。第三,當前市面上的數據庫,在分布式集群方案上的開源還有所保留。如今 Greptimev0.3 的升級,或許正是對分布式優化的回應。