如果非要給這份「存儲」加上一個期限,我希望是,一萬年。
一說到存儲,大家可能第一時間都會想到硬盤,又或者 U 盤。至于 CD 和磁帶,一部分 2000 年以後出生的新新人類或許都沒有具體的概念了。
但存儲其實一個非常大的概念。從人類早期的結繩記事到文字的誕生,從紙張的使用再到磁帶、CD 乃至硬盤的發明,甚至可以說人類文明的發展史,就是建立在存儲技術的演化上。
然而,書籍容易腐爛,照片終将褪色,硬盤的壽命不過數年,每隔幾年就要将大量的數據遷移到新硬盤,就算是因爲每 TB 成本低廉仍被廣泛用于冷存儲的磁帶,保存十年後也要維護遷移。
那麽有沒有更好的數據存儲技術和介質呢?
在微軟官方最新發布的一段視頻中,微軟宣布了 Project Silica 計劃的新進展,他們通過用激光在石英玻璃内部的「雕刻」,實現了在一塊杯墊大小的玻璃中存儲 7TB 的數據,可以完整保存長達 1 萬年。
更重要的是,我們不需要去精心地維護和更換,這也爲大規模采用這種「玻璃硬盤」保存珍貴的數據,提供了現實的基礎。
就像是《三體》中,爲了實現把地球文明「保存」1 億年的目标,作爲地球文明博物館委員會主席的羅輯,最終拍闆決定把地球文明「刻在石頭上」。
其實早在四年前,微軟就第一次将玻璃存儲的概念變爲現實。
2019 年,微軟 CEO 薩提亞 · 納德拉宣布,微軟與華納兄弟公司首次将電影《超人》存儲在了一塊 75×75×2 毫米的石英玻璃中。
保存《超人》的那塊玻璃,圖 / 微軟
微軟和華納兄弟可以說是一拍即合。微軟希望面向數據持續膨脹的未來,找到下一代的存儲技術,并将之應用在旗下的全球第二大雲計算業務 Azure 中;華納兄弟則是一直在尋找一種能夠持續保存數百年的存儲技術,而且能夠抵禦洪水、高溫以及各種自然災害。
在一份新聞稿中,華納兄弟首席技術官 Vicky Colf 表示:「我們擁有大型的娛樂媒體數據庫,這一挑戰在規模上是獨一無二的,但就問題本身而言,大規模數據存儲的需求非常普遍。一旦玻璃存儲技術被證明是經濟、高效且可推廣的,這将讓我們和各行各業中,任何想保存和歸檔内容的人都受益。」
在此之前,華納兄弟的做法是把每個文件的三個備份存檔存儲在世界上的不同地方(異地備份),都會考慮到如地震和飓風 / 台風等自然災害的發生。
但由于數據格式的更叠和存儲介質的損耗,華納兄弟還是要每隔幾年就遷移數據和更換新的存儲介質,現代硬盤就基本需要三年一遷移(微軟是五年一遷移),頻繁遷移帶來的成本不說,一旦流程出錯也可能導緻數據永久損壞或者丢失。
保存在恒溫、控制濕度的專用冷藏庫的膠片可以保存更長時間再遷移,但相應的維護成本也會更高,就算是華納兄弟這種電影巨頭也建不了多少。
問題是,玻璃存儲技術真的成爲大規模數據存儲的未來嗎?
微軟的玻璃存儲技術,簡單來說其實就是一種通過激光将數據存儲在石英玻璃中的技術。更具體地說,飛秒級(1000 萬億分之一秒)激光會在石英玻璃内部創建不同深度和角度的三維納米光栅和變形,整個過程其實就是數據被編碼到玻璃。
圖 / 微軟
原理其實與藍光光盤并無二緻,區别是光刻在内部,同時因爲光刻尺寸達到了納米級,由此可以實現大量數據的存儲。
到今天,微軟已經将一塊石英玻璃能夠存儲的數據大小從 75.6GB 提高到了 7TB,同時也更加保真,内部的物理結構可以讓數據完整保存 1 萬年之久。
而且不同于普通玻璃和其他存儲介質,石英玻璃本身的硬度可以達到莫氏 7 級,具有耐高溫、膨脹系數低、耐熱震性、化學穩定性和電絕緣性能良好等等優點。
作爲存儲介質,這也讓數據存儲變得更加安全,微軟研究團隊也對存儲數據的玻璃進行了各種暴力測試,包括微波加熱、煮沸、鋼絲球刮刷,以及在 260 度的烤箱中烘烤,當他們讀取數據時,數據仍然可以正常讀取。
耐用性測試,圖 / 微軟
換言之,「玻璃硬盤」不需要控制溫度和濕度,也不需要在維護設備和系統上投入太多的成本,甚至不用定期地通電遷移,就能實現長久的大數據存儲。另外,物理編碼的方式也決定了數據一旦儲存,内容完全不可修改,适合安全、永久地封裝各種珍貴資料,留給後世。
另一方面,雖然目前玻璃存儲技術更多是定位于冷存儲系統,不需要頻繁的存取,但也有更快的讀取速度。
讀取機器人,圖 / 微軟
當需要讀取數據時,計算機控制的機器人會自動定位和檢索對應的玻璃,快速采集偏振光透過玻璃時産生的圖像和模式,再由 Azure AI 解碼成計算機可讀的标準格式。微軟沒有透露具體的讀取速度,但解放軍報的一篇報道至少指出,「玻璃硬盤」要比磁盤和光盤都要快。
不過微軟也明确表示,要讓玻璃存儲成爲「全球 Azure 數據中心的支柱」,仍然還有一段很長的路要走。
計算機科學家、互聯網先驅 Vint Cerf(溫特 · 瑟夫)在接受 BBC 采訪時曾表達過對未來的擔憂,他認爲由于軟件和硬件的淘汰,人類保存在互聯網上的一切信息可能丢失,人類可能進入一個「數字黑暗時代」。
「互聯網之父」Vint Cerf,圖 / IEEE
這不是一種杞人憂天。
今天的人類可以讀到兩千多年前的《道德經》和《理想國》,能夠計算古代一座城市創造的 GDP,欣賞無數先人創造的藝術瑰寶。但這些思想、信息和藝術的傳承從來不是必然的,先秦諸子以及大量曾經或名聲赫赫或默默無聞的書籍、書畫和思想都丢失在了曆史長河之中。
如果不是有一個個人動手去抄寫 / 印刷(這也是一種數據遷移)和保存,無數我們珍惜的知識早就毀于火災、水害、地震、戰争、殉葬和蟲蛀。
2019 年,一篇報道中揭露了好萊塢的一場倉庫大火摧毀了 Nirvana、R.E.M.、JOHN Coltrane、Joni Mitchell 和 Aretha Franklin 等藝術家的數十盤母帶。
去年,就在全球最大種子庫的附近,風險投資集團 Elire Group 和微軟合作建立全球音樂庫,爲未來保留我們的文化,以防萬一世界末日到來或人類失去記憶,他們希望這些數據至少數千年,乃至萬年。