《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動態(tài) > 微軟探索基于玻璃的歸檔存儲新方法

微軟探索基于玻璃的歸檔存儲新方法

2023-11-24
來源:至頂網(wǎng)
關(guān)鍵詞: 微軟 歸檔存儲

根據(jù)一份16頁文件中做出的詳細解釋,微軟希望通過Silica項目探索在石英玻璃板內(nèi)存儲多層歸檔數(shù)據(jù)的可能性,而且目前距離成熟產(chǎn)品已越來越近。

微軟對其玻璃歸檔存儲項目的更新,已經(jīng)以學(xué)術(shù)論文的形式被提交至第29屆ACM操作系統(tǒng)原理大會(SOSP 2023)。

其目的是開發(fā)一套能夠讀取和寫入數(shù)據(jù)的云規(guī)模歸檔介質(zhì)系統(tǒng)。編碼技術(shù)是在方形玻璃板內(nèi)的點上生成具有偏振圖案的區(qū)域,可由3D坐標進行定義并分為幾百層。

這些偏振圖案點被稱為“立體像素”(簡稱體素),由飛秒激光脈沖所產(chǎn)生。每個體素能夠編碼3到4位數(shù)據(jù)。體素首先被并排寫入由玻璃板XY平面的2D層內(nèi),之后再被組織成矩形扇區(qū),由此在XY平面上形成超10萬個體素二維組,對應(yīng)約100 KB數(shù)據(jù)容量。一組3D扇區(qū)則構(gòu)成一條存儲軌,意味著每塊玻璃板能夠容納幾個TB的數(shù)據(jù)。

整個設(shè)計與Cerebyte技術(shù)頗為相似,后者同樣使用飛秒激光脈沖在方形玻璃板上的陶瓷涂層中激發(fā)物理變化。這些變化就是納米級的孔,類似于高科技版本的打孔卡。但Cerabyte的孔是作為二維碼的一部分所生成,而Silica項目中的體素則被放置在存儲軌之上。整塊玻璃板將旋轉(zhuǎn)在平臺上,由平臺的讀寫頭設(shè)備(即激光與偏光顯微鏡)從左到右、自上而下地移動操作。相比之下,Cerabyte的玻璃載體只能向前或向后移動,且僅可容納單層介質(zhì)??傊琒ilica項目的玻璃真正成為一種能夠隨機訪問的存儲介質(zhì)。

Cerabyte和微軟都設(shè)想用圖書庫機架的形式來容納這種數(shù)據(jù)存儲介質(zhì)——在Cerabyte的設(shè)計中,這些方形玻璃數(shù)據(jù)載體將被容納在一個個盒子當(dāng)中;而在微軟這邊,玻璃則可以獨立存在、不必額外借助容器。庫內(nèi)有一套機器人傳輸系統(tǒng),包含多臺由獨立電池供電的機器人拾取器(穿梭機)。它們就如同一群蜜蜂,能夠穿越書庫機架間的多乏善可陳水平導(dǎo)軌并垂直上下翻轉(zhuǎn),輕松完成讀取和寫入任務(wù)。微軟將其比作“受最先進倉庫機器人系統(tǒng)啟發(fā)而來的一組用于數(shù)據(jù)操作的免費漫游班車”。

1.png

微軟Silica項目的庫內(nèi),兩臺獨立機器人拾取器正在運行。

微軟表示,“讀取驅(qū)動器會以單向快速Z軸模式掃描扇區(qū),并對生成的圖像進行解碼處理。不同的讀取驅(qū)動器選項對應(yīng)不同的數(shù)據(jù)吞吐量以及較為均衡的成本和性能?!?/p>

也就是說,Silica項目的系統(tǒng)提供多種讀寫驅(qū)動器選項。

寫入機架與庫機架之間還有一個意向系統(tǒng),防止玻璃盤片被覆寫。與Cerabyte一樣,Silica項目技術(shù)本質(zhì)上也只能寫入一次,屬于物理WORM系統(tǒng)。微軟表示,“一旦玻璃介質(zhì)被寫入,機器人就無法將玻璃盤再次插入寫入設(shè)備?!币簿褪钦f在庫系統(tǒng)層級上保留實體氣隙,單個玻璃盤片會被一次性寫入并用盡全部容量。

寫入驅(qū)動器為全機架大小,可同時對多張盤片進行寫入;包含多個驅(qū)動器的讀取驅(qū)動器機架也采用相同設(shè)計。讀寫驅(qū)動器機架都需要配備冷卻、電源和網(wǎng)絡(luò)連接。

寫入的盤片在放入庫中之前先要接受讀取驗證。也就是說,新寫入的驅(qū)動器將由穿梭機攜帶至讀取驅(qū)動器。微軟在論文中指出,“為了實現(xiàn)更高的驅(qū)動器執(zhí)行效率,可以在單一讀取驅(qū)動器內(nèi)同時安裝兩塊盤片;其一接受驗證,其二供客戶讀取,且客戶流量優(yōu)先于驗證流量。”

從Silica盤片中讀?。⊕呙瑁┑降捏w素圖像將通過機器學(xué)習(xí)算法被轉(zhuǎn)換為二進制數(shù)據(jù)。讀取驅(qū)動器在XY平面上尋找相應(yīng)的存儲軌,之后在Z(深度)方向上通過單次掃描讀取整個存儲軌內(nèi)的扇區(qū)。讀取驅(qū)動器的吞吐量以30 MBps為倍數(shù)進行擴展。

微軟研究人員還分析了Azure歸檔IO模式,發(fā)現(xiàn)小文件IO(即256 MiB到256 GiB)在實際應(yīng)用中占主導(dǎo)地位,而且不同規(guī)模IO在數(shù)據(jù)中心層面的性能差異極大。也就是說,“應(yīng)當(dāng)最大限度減少庫內(nèi)機械運動的延遲,從而實現(xiàn)最佳性能”,而Silica庫應(yīng)可針對不同的工作負載模式進行定制。

Silica項目的庫系統(tǒng)使用兩種錯誤編碼技術(shù)——LDPC(低密度奇偶校驗)扇區(qū)間錯誤編碼以及網(wǎng)絡(luò)擦除編碼(NC),包括軌內(nèi)、大規(guī)模組(多軌)及跨盤等多種NC變體。

Silica庫的讀取性能、接收讀取請求與庫讀取/發(fā)送的最后一個字節(jié)間的延遲,由第99.9百分位結(jié)果定義,即由尾部完成時間定義。微軟假設(shè)“到最后一個字節(jié)的服務(wù)質(zhì)量目標(SLO)為15小時,即與現(xiàn)有歸檔服務(wù)保持一致?!?/p>

然而,這里的完成時間并不包括機器學(xué)習(xí)算法用于解碼的部分。

微軟在論文中總結(jié)道,“玻璃介質(zhì)的獨特屬性,以及軟件層面全新的云優(yōu)先協(xié)同設(shè)計,使Silica從根本上獲得了更好的可持續(xù)性,且相較于磁帶存儲顯著降低了數(shù)據(jù)歸檔成本?!?/p>

評論

這種基于玻璃的歸檔方案,標志著首個有望取代磁帶歸檔的可靠技術(shù),而且比DNA存儲更具現(xiàn)實意義。微軟和Cerabyte正著力推進這項磁帶歸檔替代成果,有望在未來五年內(nèi)推出可交付產(chǎn)品。磁帶廠商更應(yīng)該關(guān)注相關(guān)動態(tài),思考如何將其納入自家產(chǎn)品規(guī)劃路線圖。



電子技術(shù)應(yīng)用微店二維碼.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。