整理 | Ricky
作者 | 王與桐
軟件定義存儲(SDS),并不是個新概念,但是在創投圈子卻還是年輕的。
該概念發展至今已有十餘年的曆史,相關的技術和産品在2010年前後開始進入商用市場,初期主要用于互聯網等行業,具體場景是需要海量數據存儲、高訪問并發量、但是對數據的可靠性和一緻性要求并不苛刻等業務場景。
在2015年左右,随着雲計算的普及,以及移動互聯網進入井噴期,數據量急劇增加,因此軟件定義存儲/分布式存儲開始在企業級市場得到大量應用,尤其是在虛拟化和雲計算環境中,存儲資源需要池化和彈性擴容,軟件定義存儲搭配普通服務器硬件組成分布式存儲集群成爲當然之選。由于分布式架構和軟件定義帶來的諸多優勢,SDS也被公認是數據存儲系統的未來發展方向。
從SDS技術的現實情況來看:
一方面,SDS在公有雲平台上得到了廣泛的應用。目前所有的公有雲大平台,它們的存儲架構都采用的是軟件定義存儲架構,不會有任何公有雲使用以EMC爲代表的傳統存儲架構。
另一方面,目前整個企業級市場在存儲領域的投資仍然集中在傳統存儲架構上,采購的也大都是傳統的存儲産品。而華瑞指數雲主要是面對企業級市場,目前SDS的市場份額占比還比較低,并且主要應用于中低端業務場景,但是随着企業IT架構的現代化升級和演進,未來增長空間較大。
另外,SDS本身也需要叠代升級——從1.0進化到2.0——這也是華瑞指數雲想要做的。
36氪此次采訪了華瑞指數雲聯合創始人&CTO曹羽中,以及華瑞指數雲早期投資人明勢資本董事總經理徐之浩。曹羽中曾任華爲公司雲與計算BG 西歐區 CTO,華爲公有雲創始核心專家,華爲私有雲首席架構師,美國IBM私有雲産品SCE首席架構師等,對雲計算賽道以及軟件定義存儲賽道有着縱深的理解和廣闊的視野。他将從"科普"的角度,解釋SDS是什麽,爲什麽我們要進入SDS2.0時代。
以下是對話實錄,36氪整理:
36氪:軟件定義存儲這個行業還在發展過程中,能不能先簡單介紹一下該行業的基本情況。
曹羽中:軟件定義存儲這個概念已有十餘年的曆史。從技術願景的角度來說,自從這個概念推出以來,整個産業界都認可這是存儲領域的發展方向和未來,比如Gartner從2015年起一直到最新的2022年,在其每年發布的"存儲和數據保護技術周期報告"中都把SDS列爲存儲領域的變革性技術,甚至是唯一的變革性技術。
從該技術的現實情況來看:一方面,它在公有雲平台上起到了很大的作用。目前所有的公有雲大平台,它們的存儲架構都采用的是軟件定義存儲架構,不會有任何公有雲使用以EMC爲代表的傳統存儲架構;另一方面,目前整個企業級市場在存儲領域的投資仍然集中在傳統存儲架構上,采購的也是傳統的存儲産品,SDS産品雖然也開始在一些企業廣泛部署使用,但是主要應用于中低端業務場景,它們并沒有選擇大步朝軟件定義存儲的方向邁進,在我看來,這是一個錯位。
公有雲全部采用了SDS方向的技術,但企業市場并沒有。我們團隊曾經長期從事公有雲IaaS層分布式基礎軟件的研發,最大的願景是用軟件定義存儲的架構真正改變企業對其的抵觸心态。
另外一些比較深層次的原因,軟件定義存儲在企業級市場上并沒有大廠家出現,傳統存儲巨頭很難從戰略層面對SDS産品進行大規模投入,大型公有雲廠商主要把SDS當作整體IaaS底座的一部分。這也預示着這是一個會有很大變革機會的領域。
從IT基礎架構的發展來看,存儲架構與計算架構是需要配套發展的。從計算架構的角度來說,其實已經大步邁向分布式架構,微服務架構,分析型引擎,數據驅動計算等新範式,整個企業級應用都在朝向雲原生應用發展。但是對于存儲架構來說,在今天的線下的企業級數據中心市場,很大一部分投資還是在集中式架構,硬件形态爲主的傳統存儲陣列,雖然也有一些企業已經部分采用了SDS,但隻用承載外圍的中低端應用,隻占其存儲投資的小部分,沒有進入的主流賽道,遠遠不足以驅動企業數據架構的大變革。
我們團隊希望使用軟件定義存儲的架構完成整個企業級存儲架構的演進,讓它變成一個統一的SDS架構,進而支撐起整個企業的數據底座,我們計算架構的雲原生架構以及應用架構将向新的應用形态演進,整個趨勢都能把它匹配起來,這也是我們的總體方向。
36氪:SDS分布已經從1.0時代發展到2.0時代,可以詳細地介紹一下二者有哪些區别嗎?行業的哪些變化又導緻了這些區别的産生?
曹羽中:SDS1.0誕生的這十多年時間裏,其被貼上了中低端存儲的标簽,沒有進入企業存儲的中高端市場,更不足以成爲真正的企業級存儲架構的變革者和主流選擇。
第一代SDS軟件(SDS 1.0) 起源于18年以前,開源Ceph軟件爲典型代表,随着互聯網,雲計算和大數據時代的到來獲得了較爲廣泛的采用,但是第一代SDS軟件(SDS1.0)存在先天不足——面向慢速硬件和網絡時代設計,存儲系統的IO處理效率局限性明顯,IOPS低、時延大,性能穩定性和可靠性都難以匹配企業關鍵業務的需求,且進化速度也比較緩慢,SDS 1.0不可避免地進入了瓶頸期。
存儲産品最重要的幾個性質是可靠性、性能與時延。盡管1.0版本理念與方向是先進的,同時天然地貼合企業未來發展,可惜在上述三項核心能力上沒有達到集中式架構應有的水準。所以我們提出2.0的新概念。SDS 2.0作爲新一代存儲系統軟件,首先需要适應新興的高速硬件和網絡技術的要求,通過軟件層IO棧的颠覆性的改變,實現IO處理效率的數量級提升,能夠充分的壓榨出新一代硬件的極限性能,能夠通過軟件技術創新,而不是依賴于專屬硬件設計,來提升系統的總體可靠性,故障容錯能力和故障恢複的效率,在IOPS,時延,可靠性等存儲系統的核心指标上,能夠達到替換傳統高端存儲陣列的水準。其次,面向海量數據處理場景,需要提供高吞吐,大并發,性能和容量的線性擴展能力,支撐高性能,低時延的數據實時分析處理。第三,企業在數字化轉型過程中,會經曆一場深刻的轉變,從以應用和業務流程爲驅動,轉變爲以數據爲驅動,企業迫切需要構建新一代數據基礎設施,能夠實現數據的天然的共享存儲,共享訪問,統一管理和智能流動,還能更好地滿足數據跨越混合多雲及邊緣的應用需求。爲了滿足這樣的需求,SDS2.0作爲一個統一的存儲系統軟件,需要從架構和元數據管理層面有充分的前瞻設計和全新的工程實現。
36氪:關于SDS叠代,爲什麽會從1.0時代進化到2.0?
曹羽中:我從兩個方向回答。一方面,是需求側發生的變化;另一方面,是技術側發生的變化。
從需求側來說,一個是AI,另一個是國内的信創,需要我們核心的系統或數據庫搬到國産自主可控的大平台上,存儲技術就包括其中。企業IT雲化轉型走向深入,會把更多的企業關鍵應用,核心應用,各類圍繞着OLTP數據庫構建起來的系統遷移到國産自主可控的雲化平台上,在這個過程中,雲平台對于軟件定義存儲技術提出了更高的要求,需要軟件定義存儲具備以軟件定義的方式去替代各類傳統存儲和全閃陣列的能力。 數字化技術和AI的廣泛采用,将推動大數據的分析和應用由原來的批處理走向實時數據分析,将需要存儲層在應對海量數據存儲高并發訪問的同時,提供更低的IO讀寫時延。從存儲系統的信創角度,我們并不能僅僅滿足于研發同質化的産品實現對國外存儲系統的平替,信創存儲産品能夠借助軟件定義存儲的架構實現彎道超車,換道超車,實現我國在企業存儲領域的超越。
從技術側來說,首先計算範式發生了很大的變化,比較明顯的是原先的算力主要通過CPU形式來提供,往後更多的通過GPU這類更專用的硬件形式提供。GPU極大的提升了數據的并行處理能力,與CPU讀取和處理數據的方式是很不一樣的,需要有跟它的并行處理能力相匹配的數據底座。就比如取外賣時隻有一個外賣架投入使用,在外賣不多時是可以滿足需求的,在GPU運算時代,可能相當于整個公司的人都同時去取外賣,原先的外賣架就不能滿足需求了。
過去十幾年來,硬盤介質和網絡等基礎硬件發生了很大的變化。譬如存儲介質已經實現了大規模的從機械硬盤向SSD固态硬盤的過渡,由此帶來了硬件層面的超高IOPS和超低時延,新興SSD介質相比磁介質,性能提升了1000倍,訪問時延下降了數百倍,達到了10us級;網絡帶寬由過去的10M和100M已經提升到現在的10G和100G, 提升了1000倍,随着RDMA等新興技術的出現,網絡訪問時延已經下降數百倍,達到了10~20us的水平。然而,目前市場上主流的第一代SDS的IO軟件棧還是采用的15~18年以前的系統架構,處理單個IO的時延會達到幾百us之多,比今天的網絡和介質要慢一個數量級,軟件IO棧已經成爲了整個數據存儲系統的主要瓶頸。
打個比方,2005年的遊戲是沒有辦法把2023年的電腦跑滿的,硬盤,網絡等處于一個很閑的狀态,也沒有辦法把今天的3090,4090顯卡充分的用起來給用戶帶來優秀的體驗。客戶花錢買下新一代硬件,但可能硬件上隻有10%左右的潛力被挖掘出來,還有90%的IO能力被閑置,這不就是一種資源的巨大浪費嗎。
其實我們可以這麽說,通用标準硬件發展到現在這個階段,再加上軟件技術的完整革新,在存儲領域我們已經具備用SDS軟件+通用标準硬件完全替換掉集中式架構的高端存儲陣列的能力了。
36氪:您提到的"硬件到目前這個階段"是從什麽時候開始的?
曹羽中:硬盤介質方面,NVMe SSD相比傳統的機械硬盤HDD,從性能,時延,可靠性等維度都是遠遠優勝,除了成本。實際上最近這幾年NVMe SSD的每TB成本一直在下降,大家對它的預期是等NVMe SSD的成本進入到所謂的颠覆點,到了這個點之後,企業的熱數據存儲乃至溫數據存儲都不會再采購機械硬盤,企業采購全閃介質的投入就會大于HDD上的投入,企業數據中心的全閃時代就到來了。這個時間點預期在未來幾年就會出現,當SSD的成本下降到某一點時,整個企業級市場就沒有再去采購HDD作爲主存儲介質的理由。就像筆記本電腦實際上就已經發生類似的事情,從某個時間點起,所有的筆記本電腦裏就都沒有機械硬盤了。
企業數據中心網絡的大變化其實很快也會發生。基于RoCEv2協議的RDMA正在走向大規模成熟商用。目前的新一代25GE以太網交換機和網卡中,RoCEv2幾乎已經是标配了,随着企業網絡從10GE向25GE的升級,企業數據中心網絡大範圍支持基于RoCEv2協議的RDMA網絡是在幾年内即将發生的事,RDMA網絡的超低時延,将極大的利好于分布式架構和存算分離架構,也爲分布式的SDS軟件在要求高性能和低時延的業務領域去平替集中式存儲提供了現實基礎。
技術此消彼長時就會出現交叉點,我們已經看到了交叉的趨勢,等待交叉點的到來。在硬件升級的交叉點到來時,我們希望通過實現SDS軟件的換代升級,使SDS這樣的産品形态有能力切入企業更核心,更高端的業務系統,進而實現SDS換代替換傳統硬件盒子式的存儲産品的交叉點。
36氪:所以我可以理解爲,目前這個領域仍處于市場教育的階段,你們現在所做的是搶占窗口期,等到時間點到來的時候,你們已經成爲占領市場的一方?
曹羽中:現在NVMe+RDMA網絡這樣的硬件組合還屬于比較高端的市場。隻有在比較高端的業務場景裏,客戶才會考慮掏錢購買NVMe SSD加RDMA網絡這樣的配置。但是如前所述接下來幾年這個配置就會成爲一種硬件采購的标配,會成爲一個通用的主流市場。這種情況下,我們的新一代SDS2.0這樣的軟件架構産品的市場規模、可以觸達的客戶業務場景将會快速擴大。
現在我們和客戶談的是,在今天主流的普通機械硬盤HDD加10GE TCP/IP網絡的硬件條件下,我們的SDS2.0軟件相比市場上的SDS1.0産品也會有幾倍的性能提升,但它還不是颠覆性的,但是當你硬件環境進化到NVMe SSD+RDMA網絡的層次,SDS2.0軟件架構相比市場上的SDS1.0軟件的性能提升将達到幾十倍,是碾壓式,颠覆性的提升,故障恢複速度,可靠性的提升也将是巨大的。客戶幾乎沒有任何理由在NVMe SSD+RDMA網絡這樣的新一代高速硬件上使用低速的SDS1.0時代的SDS軟件。
36氪:SDS2.0與AFA的關系是?
曹羽中: 在過去的行業認知裏,SDS産品是低端存儲,FC SAN混閃陣列是中端存儲,AFA全閃陣列是高端存儲。我們推出SDS2.0産品WDS,是軟件定義的分布式架構,但是完全攻克了過去分布式存儲架構IOPS低,時延大,時延不穩定的固有缺點,從IOPS,時延,可靠性等核心指标上來評價,是可以達到乃至超越AFA高端全閃陣列的水準的,可以作爲AFA的一個更現代化的替代品。SDS2.0又不僅僅是對AFA的平替,WDS有許多AFA做不到的能力,比如純軟件交付,容量水平擴展,性能線性擴展,自動化的資源調度,與雲化環境/雲原生環境的無縫融合,無特定硬件依賴,業務無損的無縫升級擴容,與計算引擎的協同優化,數據的池化和智能流動等等。所以SDS2.0在企業存儲架構的現代化演進上面将扮演主要的角色。
打個比方,假設一個很極端的場景,華爲雲或者阿裏雲使用AFA的存儲架構,如果用戶需要申請網盤,它們做的事就是往裏頭堆一根線,說:"兄弟,hold住,我往那堆一個機器,堆完以後再接到裏面去。"然後再打個電話給客戶說:"兄弟,現在可以使用了,你用的是什麽端口?"
極端一點就是這樣。爲什麽全球的大型公有雲平台不采用AFA這樣的存儲架構和産品去承載企業級應用呢?有成本的因素,采購商用的AFA産品很昂貴,硬件的備件更換等等也需要采購專門的硬件,顯著的增加了備件采購成本和運維成本。更重要的是技術上的考量,因爲傳統的AFA架構首先是一個硬件,由管理員基于複雜的配置去定義和創建所謂的LUN,它與雲計算所要求的完全自動化、API驅動、靈活彈性擴展和資源池化共享是格格不入的,從運維監控的角度,AFA也沒有辦法完全融入雲平台的自動化監控運維體系,擴容升級等運維操作将非常複雜,從資源共享和數據共享的角度,一套一套的AFA本質上就是割裂的數據孤島,無法滿足存儲資源池化共享和數據智能流動的需求。
36氪:這涉及到另一個老生常談的問題,剛才提到企業替代AFA的成本是昂貴的,同時你們主打企業級市場,對于你們的客戶來說,它們有動力去完成替換嗎?
曹羽中:幾個驅動力:
第一,整個業務架構要向雲架構轉型,這是業務領域很重要的驅動力。AFA跟雲化架構,雲原生架構的需求無法完全匹配。
第二,從節約成本的角度來說,随着數據量越來越大,客戶需要的存儲空間與性能也越來越大,在這種情況下,如果完全用AFA硬件架構來搭建,總的成本會是一個天文數字。這是無法支撐的。
第三,是新興業務形态,以GPU計算、以實時數據分析或AI訓練爲代表的業務場景,數據量不僅大,同時又要求高性能和高吞吐,這種情況下使用AFA極度不經濟,這些新型業務形态天然地需要分布式的SDS架構。
所以這是三個主要的驅動力:即老業務雲化的需求、成本驅動和新興業務場景,這都是SDS2.0比較完美适配需求的地方,所以企業的動力是很充足的。
另外,也不用局限在平行替換現有AFA這個點上,更重要的是面向未來的發展如何新建,企業如何采用新的思維,新的架構去建設其下一代的存儲架構,乃至一個統一的存儲平面和數據底座,這個是SDS 2.0能夠帶給企業客戶的更大的價值。
36氪:像您剛才提到的,目前這個行業裏有很多痛點,它需要新的架構去解決,爲什麽其他的公司或者說其他的這些技術人沒有發現問題,沒有想到用這種改變。
曹羽中:這裏有幾個因素。
一個是本身技術能力沒那麽強的公司比如創業公司或一些大廠,他們技術發展思路基于某開源組件的修改,然後去優化性能。可1.0的軟件架構再怎麽修改也不是2.0的,它永遠都是一個漸進式的修補。這一類廠家對技術本身缺乏把控能力,他們沒有勇氣、架構能力和工程能力去抛開原有的開源架構去設計2.0架構,并使它真正地工程落地,這是做不到的。這一類廠家可以歸結爲"能想得到,但做不到"。馬車再怎麽樣做優化修改,也成爲不了汽車。
第二類廠家已經想到,并且也在做。這些廠家以公有雲爲代表。我們本身是公有雲團隊,我們有能力做這件事情,是因爲我們在過去10多年一直從事雲底座的研發,經曆了這方面的思考和工程實踐。目前在做這件事情的有幾個公有雲巨頭。
公有雲需要通過SDS架構去承載越來越多的企業業務,不會借助AFA這種硬件架構來完成這件事。因此,他們有很多業務壓力來迫使他去做這件事。目前阿裏華爲還有其他雲巨頭,對底層的 SDS架構做了大量研發和升級。但其中的問題是以公有雲平台爲中心進行設計實現,這意味着它很難線下産品化交付。阿裏雲沒有辦法把它以輕量化産品化的方式搬出,賣給某一個企業使用。從架構設計的一開始,他就沒有針對這種目标,也由于沒有針對這種目标,他們的架構需要對硬件進行依賴。
公有雲講究以最快的速度推出,很多性能不足的地方,需要硬件進行補充,他們天然就會采取這種措施。公有雲的存儲架構裏,底層可能使用類似傲騰這樣的硬件做加速。對于客戶來說,客戶并不想買傲騰。這就是公有雲的問題所在,它面向雲平台架構,爲雲服務而設計,規模比較大,有很多依賴。
第三類廠家是傳統存儲巨頭,以EMC爲代表。它們有相關的技術能力與資源,沒有這方面人才也可以再招。它們沒有來做這件事情最重要的因素是定位問題。傳統存儲端已經做了分布式架構,但不能做成軟件定義存儲這類分布式的存儲,因爲它不提供純軟件的交互形态。這是基于商業策略來考慮的,所以不提供軟件,而是提供完全一體化的産品,這是第一個缺點;第二個缺點是,傳統巨頭将其集中式存儲架構定位爲中高端系列面相核心數據,把分布式存儲體系定位爲中低端系列面向海量數據。從産品定位就畫了一條線,他們就沒有動力、投入和決心。他不會用左手去打自己的右手,雖然現在是左右兩個手都硬。這也是EMC和華爲這些公司的策略,沒有變革的巨大推動力。因爲兩條線都是市場的主要玩家,有着比較高的市場占有率,所以不會産生變革性投入。這跟所有大廠很難做颠覆性創新是一個邏輯。颠覆性的東西不會砸資源把它完成,大概就是這麽一個市場格局。
36氪:你剛才提到企業存儲架構有更新叠代的必要性,從企業客戶的角度考慮,他們會選擇什麽時候進行更換,你們有考慮過這個問題嗎?
曹羽中:這是漸進的,不是一蹴而就的。就像現在使用雲化架構去替換企業現有架構,一定是小幅度地試探,一點點推進。而不是一夜之間把原先的AFA全部扔掉,換成SDS2.0這種産品。
36氪:所以你們現在有看到他們一點一點地在試探是嗎?
曹羽中:各行業的企業正在把越來越多的業務做雲化,做分布式改造,做雲原生改造,做基礎架構硬件的标準化,這個事情一直在推進。剛開始可能是開發測試業務,外圍的業務,然後再做普通業務系統,最後再到準核心,核心業務系統,他會一步一步向前演進,在這個過程中,他會進一步思考他總體系統架構,計算架構,存儲架構,數據架構等。
當SDS2.0這樣的産品出現之後,由于這是一個面向未來的新一代技術,具備各方面的優勢,又可以支撐當前必須要用AFA才能承載的業務,這時企業就有機會有意願選擇SDS2.0而不是傳統存儲和AFA,并且還可以考慮采用SDS 2.0的技術方案構建企業的統一存儲底座,徹底改變過去爲不同的業務系統采購和部署不同的存儲硬件的堅井式建設模式。這個過程需要有一定的總體規劃,但是肯定是需要逐步去落地的,就像我們說的去IOE,這絕對不是一夜之間完成的,需要慢慢往前推進。
36氪:說到國産數據庫替代Oracle,可能現在我們很多的國産數據庫,包括一些分布式數據庫或者開源數據庫,放了很多新的技術概念在其中。他可能适合很多新的場景,但其實跟Oracle相比,他們有不夠穩定的問題。這可能是很多企業沒有辦法下定決心從Oracle切換到國産數據庫的一個原因。作爲一個創業公司研發的創新産品,穩定性不如市場主流成熟産品是完全可以理解的,但從客戶的角度來說,他們不會因爲是新成立的公司就花錢爲産品的不穩定性買單。所以我想了解一下華瑞是如何考慮這個問題的?
曹羽中:這是一個非常關鍵的問題。從技術方面來說,我們具備領先的優勢和面向未來的産品,但阻礙我們的産品真正的走向大規模的生産應用的最核心因素之一就是你所提到的"穩定性"。企業客戶對于産品穩定性的擔憂,有時候是對技術架構不了解引起的,有時候又僅僅表現在心理作用,對于沒有經過長時間的市場驗證的産品的一種不安全感。
先從技術的角度來說,SDS軟件作爲分布式架構,它本身從可靠性與穩定性的設計上與存儲陣列,AFA完全是不同的思路。存儲陣列,AFA的硬件是專門設計的,更多的依賴硬件的可靠性,硬件的冗餘來實現全系統的可靠性,穩定性和可靠性确實是高端存儲陣列經過長期市場考驗建立起來的口碑。
我們的SDS産品作爲分布式架構軟件,跑在通用硬件上,其穩定性和可靠性的設計邏輯是首先假定硬件是不可靠的,更多的是從軟件層面來整體實現全系統的可靠性和穩定性。分布式系統的系統架構原則是沒有單點故障,具備故障容錯能力,具備故障自愈能力,能夠及時識别有故障的硬件,亞健康狀态的硬件,将這些硬件踢出集群,在這個過程中,對上層業務不産生任何影響。在我們的SDS2.0軟件架構中,我們在軟件層面實現了更多的可靠性和穩定性保障措施,比如極速的分布式複制狀态機,能保證數據的強一緻性同時又具備10微秒級的數據複制時延,可以提供極速的故障恢複能力,通過副本數據比對,端到端dif, 多級故障域,分布式鏈路追蹤等多重手段來進一步保障數據的可靠性和一緻性。
其次呢,通用硬件本身的可靠性其實也一直在提升,比如NVMe SSD介質的可靠性就比機械硬盤高幾個數量級,普通x86服務器的可靠性也一直在提升。20多年前,業界曾經普遍認爲x86服務器是不夠可靠的,企業的核心業務一定是要跑在小型機上才放心,但是在過去的10年來,我們看到幾乎所有的企業都在把核心業務從小型機上下移到x86平台上來,小型機逐步在市場上消失了。所以我們堅信,SDS軟件+通用硬件,在可靠性和穩定性上面追上乃至趕超高端存儲硬件是一定會發生的。
第三點,SDS作爲分布式架構軟件,是更容易與雲化環境融合形成互動的。因爲雲原生架構的上層業務注重資源的彈性伸縮、快速創建,重啓和删除。作爲雲原生架構的SDS存儲能夠更天然地與雲原生應用産生互動,應用層很容易實現存儲資源感知和自動化管理,然後可以采取計算和存儲聯動的一些可靠性措施,這種更高層面的系統可靠性也就超越了傳統高端存儲陣列所強調的存儲可靠性了。
至于企業客戶選擇新産品的心理擔憂的問題,是需要一定的時間來解決的。實際上企業客戶乃至具體的信息化技術負責人有很多種類型,有的保守派,有的是追随者,有的是激進派。現在有很多企業客戶有切實的痛點,如果再加上在選擇産品方面并不保守,在新技術上面願意大膽嘗試,這些就是我們理想的早期客戶,我們需要這樣的客戶幫助我們破冰,去培養市場的聲譽和口碑。當然,我們本身從産品和技術層面是要做好充分的可靠性保障的,包括建設完備的運維能力和售後維保體系。在業務有痛點需要解決,新産品本身可以帶來顯著的價值的基本前提下,我們相信品牌和信任是可以逐步建立起來的,企業客戶的認知和産品選擇習慣是可以逐步改變的。當然,這個一定需要一個比較長的周期,這也是爲什麽我們認爲在企業級市場要發生一次真正的技術變革需要一個10年的長周期。
36氪:關于你們跟一些硬件廠家的合作,具體是如何做的?比如你們的産品的極速性能是需要在某些固定的硬件上才能發揮作用嗎,還是在通用硬件上都可以,合作的形式是怎麽樣的?
曹羽中:首先作爲一款基礎軟件,我們最重要的架構設計邏輯是不依賴任何特定硬件。這是我們和很多存儲産品最重要的區别之一。有些存儲産品宣傳的性能也很強,其實它是有前提條件的,比如使用了傲騰持久化内存來存儲元數據,如果缺少這一類特定的硬件,他的性能就會大打折扣,甚至是運行不了。
我們把類似傲騰這種硬件歸爲非标品,因爲他目前還是比較特殊、價格昂貴、未得到廣泛采用的新硬件。在我們的SDS軟件體系裏,沒有對非标品硬件的特定依賴,對于已經在市場上得到大量應用的通用硬件又提供了廣泛的兼容性支持,客戶可以選擇不同類型的CPU架構,包括Intel,海光,鲲鵬,飛騰等,可以選擇不同品牌,不同類型的硬盤介質,包括機械硬盤,SATA SSD, NVMe SSD,SCM SSD等,實現了從低端硬件到最高端的硬件的全覆蓋支持。
同時我們架構設計的另外一個原則是要壓榨出硬件物理性能的極限,硬件能跑多快,我們的SDS軟件就能跑多快,對外提供相對應的存儲IO讀寫性能和帶寬,并且保證穩定的低時延。在我們跟英特爾做一次聯合測試中,特地選擇了基于PCIe 4.0接口的英特爾傲騰P5800X,這是市場上性能最高的商用SSD之一,單盤就能跑出150萬IOPS。測試結果表明,我們的SDS2.0軟件WDS, 使用單個進程就可以将一整塊英特爾傲騰P5800X的峰值能力發揮出來,也就是達到近150萬 IOPS。整套分布式存儲系統對外能提供的峰值集群性能與系統中的硬盤介質的物理極限性能的總和基本相當,證明軟件側沒有瓶頸,能驅動最高端硬件的極限性能,轉化爲客戶業務能夠使用的IO讀寫能力。
還有一類硬件叫DPU,對此我們的架構設計原則是不依賴于任何特定DPU,但是又預留開放架構與DPU硬件做協同,讓DPU起到錦上添花,提供更多附加價值的作用。
還有一類硬件叫是計算型存儲,就是SSD介質内部擁有一定的計算處理能力,能夠在SSD介質内部提供壓縮,解壓縮能力。我們也是在SDS軟件裏面預留開放架構與這一類計算型存儲介質做協同,這樣可以在某些業務場景,給企業客戶提供更有價值的方案。
36氪:徐總,假設現在有兩家公司,他們能做出同樣的事情,但一家性能更出色,另一家穩定性更出色,穩定性更好的公司性能可以達到60分,另一家公司在某些點上的性能能做到90分,你們會選擇投哪家公司呢?
明勢資本徐之浩:我認爲對于存儲産品來說,穩定性和可靠性都非常重要。往往對于一些新興的增量的場景,首先性能要滿足業務要求,如果性能滿足不了要求,再穩定也無法使用。
我其實有這個答案,之前遇到過類似的情況,客戶是願意爲了滿足業務場景的性能需求、在中短期忍受穩定性的欠缺。在性能能夠滿足業務要求的前提下,穩定性和可靠性就會成爲關鍵考慮因素了。我們會參考客戶訪談,團隊是否有做過同類商用産品的經驗,團隊的軟件工程能力和可靠性工程能力等來評估一家公司是否有能力研發出能夠穩定上生産,并且可以大規模複制銷售的存儲産品。
36氪:行業裏其實也有一些所謂在做軟件定義存儲或SDS這樣的公司,比你會覺得他們和華瑞之間現在聊的華瑞有什麽區别?從投資的角度來說,你認爲什麽樣的公司未來的商業價值更高?
明勢資本徐之浩:團隊在願景上,在技術能力上,在選擇的技術路線上,有沒有成爲行業的變革者和颠覆者的可能性,是我最看重的。可以比較明确地看到一個點是,大家可以去判斷一家存儲創業公司的産品是不是基于海外一些開源的存儲系統軟件在做,如果是的話,大概率做的就是SDS 1.0時代的産品。我對比較流行的開源的存儲系統也都有所了解,這類開源存儲系統的技術架構都比較過時了,發展潛力也有限,是不具備挑戰市場上的成熟集中式存儲産品,變革數據存儲行業的潛力的。我在華瑞指數雲看到了我看重的東西,我覺得這是比較核心的區别。
另外一個核心的區别是,雖然目前我們看技術看軟件,但商業化能力是非常重要的。我們确實能看到一些具備很強技術創新能力,或者技術方向在未來會有較大市場空間的一些創業公司大部分都走不到後面。這往往是因爲早期,純技術創始人在商業路徑上的思考很容易彎路。現在的資本市場不是特别好,即使是在資本市場很好的時候,給創業公司的容錯空間也不見得有那麽大。像華瑞公司的話,兩位創始人中,羽中負責技術多一點,另一位創始人亮總,在做業務方面有很豐富的經驗,不僅在國内有經驗,在海外也有常駐的經曆,負責一個區域的業務。我覺得這個點對我們來說是很重要的。
綜合這麽考慮,一方面我們還是希望在産品上做到創新的。現在大家都喜歡講國産替代,稍微有追求一點,我們更希望我們做的是國産升級。很多時候純粹的國産替代會面臨很多問題,大家的産品會同質化,隻能切入相對低端且低毛利的場景中。所以在産品技術上,我們希望有國産升級的可能性。另外團隊上帶來的差異也比較大,無論是技術、産品還是商業,這都是很強的一支團隊,我覺得這一點也是挺關鍵的。
我再補充一個小點,是我們當初在接觸時讓我感觸很深的一點。我們一直在投各類軟件項目,可以看到很多軟件的創業公司早期并沒有在測試穩定性和質量保證上投入特别多精力,他們想先把東西做出來,然後再慢慢考慮後面的事。但華瑞這個團隊,我們在早期的時候就發現,他們很早就投入了很多錢去建設自動化測試環境,進行各種故障注入和長期穩定性測試。華瑞有一個完全自用的機房,現在差不多有160台服務器組成各類測試平台。這個投入是非常誇張的。說實話我覺得中大型互聯網公司裏能把測試環境維持到100多台的都非常少。他們本身就是華爲出來的團隊,非常了解穩定性和可靠性對企業軟件的重要性,在特别早期的時候,就投入了很多的資源和精力去構建環境和自己的測試體系,這給我的印象非常深。我們也投了很多數據庫類的基礎軟件,穩定性确實是早期基礎軟件需要邁過的一道坎,華瑞在這方面的意識和實際的投入是非常足的。