存儲可以在很多方面為醫(yī)學研究提供支持,尤其是與大腦成像硬件相關(guān)的領(lǐng)域。美國斯坦福大學是如何在其最近的研究項目中利用高速存儲的呢?
在醫(yī)學領(lǐng)域,快速存儲能支持研究人員存儲和解析大型數(shù)據(jù)集。一個超大型數(shù)據(jù)集的示例就是斯坦福大學的 MultiMAP 項目,該項目用于跟蹤、記錄并分析斑馬魚大腦中神經(jīng)細胞的活動。
斯坦福大學的 MultiMAP 是做什么的?
在斯坦福大學的一篇新聞稿中,科學作家 Bruce Goldman 解釋說,MultiMAP(分子和活動表型的多重比對)支持研究人員“跟蹤斑馬魚大腦中的幾乎每一個神經(jīng)元,然后確定每個相關(guān)神經(jīng)元的細胞類型?!盡ultiMAP 背后的斯坦福大學團隊利用技術(shù)確定了腦回路實際上與警覺性有關(guān)。
斯坦福大學跟蹤了斑馬魚大腦中的神經(jīng)元,將大腦活動與警覺性聯(lián)系起來。 圖片來自 NICHD。
斯坦福大學生物工程及精神病學和行為科學教授兼霍華德·休斯醫(yī)學研究所研究員 Karl Deisseroth 告訴 Goldman,“我們在魚存活期、細胞處于極度活躍狀態(tài)時跟蹤它大腦中的每個神經(jīng)元,并了解了魚的警覺性最高時哪些細胞最活躍。然后,在不改變魚頭部細胞相對位置的情況下使用固定劑保存魚的腦組織后,我們可以使用分子探針找到相關(guān)神經(jīng)元并確定其細胞類型?!?nbsp;
這項技術(shù)本身需要大規(guī)模運作,因此需要處理單元附近部署大量低延遲、高速的存儲才能實現(xiàn)正常運轉(zhuǎn)。隨著此類大腦成像技術(shù)的持續(xù)發(fā)展和進步,存儲也要迎頭趕上。
MultiMAP 極其重要,因為它收集的數(shù)據(jù)對心理健康有極大影響。Goldman 特別指出,睡眠不足與抑郁癥均和缺乏警覺性有關(guān),而焦慮癥、躁狂癥與創(chuàng)傷后壓力心理障礙癥 (PTSD) 和警覺性過度有關(guān)。
Deisseroth 說:“新發(fā)現(xiàn)開拓了一條全新的深入探索之路。我們越了解警覺性等大腦狀態(tài)下的神經(jīng)元構(gòu)造,就會越了解大腦狀態(tài)這個概念本身,我們甚至能夠幫助設(shè)計針對大腦狀態(tài)的臨床干預(yù)措施?!?/p>
要踏上這條“深入探索之路”,快速存儲至關(guān)重要。斑馬魚幼體有大約 100,000 個神經(jīng)元,每個神經(jīng)元產(chǎn)生的數(shù)據(jù)都需要被記錄、存儲并快速仔細地梳理,才能獲取重要的數(shù)據(jù)點。成年斑馬魚有大約 1,000 萬個神經(jīng)元,這對斯坦福大學的 MultiMAP 技術(shù)的要求呈指數(shù)級增長。相較之下,人類大腦則包含 860 億個神經(jīng)元。
人類的神經(jīng)元數(shù)目是斑馬魚的 860 多倍。
哪類存儲能夠繪制大腦構(gòu)造呢?
美光科技技術(shù)營銷高級經(jīng)理 Jason Echols 表示,在處理如此多的信息、繪制大腦構(gòu)造并確定其決策和功能時,研究人員便進入了快速數(shù)據(jù)領(lǐng)域。為了處理如此多的數(shù)據(jù)并分析其中的重要數(shù)據(jù)點,MultiMAP“讓人工智能和機器學習變得稍稍清晰可見了一些”。
Echols 說,“他們需要進行大量的并行處理。當他們需要將數(shù)據(jù)納入決策流時,他們不僅僅是在思考,實際上是在提取數(shù)據(jù)并予以分析?!?/p>
Echols 表示,從事 MultiMAP 項目等工作的醫(yī)學研究人員在竭力“優(yōu)化存儲基礎(chǔ)設(shè)施以獲取最佳性能”,尤其是當他們處理斯坦福大學研究人員在腦細胞中觀察到的海量數(shù)據(jù)時。
“你會發(fā)現(xiàn),英偉達和其他一些企業(yè)都在這些領(lǐng)域與他們進行合作?!盓chols 說,“他們?nèi)绾问勾鎯婢叱杀拘б婧统焖俣龋屵\行這些數(shù)據(jù)所需的所有計算核心都能獲得需要的數(shù)據(jù)呢?這才是真正有意義的對話?!?/p>
推動所有存儲的發(fā)展
Echols 表示,存儲研究能為醫(yī)學研究提供動力。隨著精簡、快速且高效的存儲解決方案不斷在新應(yīng)用中實施,這一領(lǐng)域的方方面面均將受益。
Echols 解釋說,在研究人員和前沿思想家正大規(guī)模應(yīng)用內(nèi)存和存儲的多種方式中,其中有八種應(yīng)用正推動著前沿科學和醫(yī)學的發(fā)展:
大數(shù)據(jù)與分析
物聯(lián)網(wǎng) (IoT) 設(shè)備
混合云
非易失性存儲主機控制器接口規(guī)范 (NVMe) 和單根輸入/輸出虛擬化 (SRIOV)
橫向擴展架構(gòu)
人工智能 (AI) 和機器學習
安防
軟件定義的存儲 (SDS)
Echols 說:“僅看存儲方面的業(yè)務(wù),這些是我們在宏觀趨勢層面真正能影響到的領(lǐng)域?!?/p>
美光科技首席技術(shù)營銷工程師 Tony Ansley 表示,上述很多應(yīng)用均能從與精簡存儲這一基本概念中獲益:更快速地存儲和計算數(shù)據(jù)。比如說,如果研究人員可以判斷某個神經(jīng)元是處于活躍狀態(tài)還是不太活躍狀態(tài),他們就能更快速地得出結(jié)論。
Ansley 說,“它不僅是存儲技術(shù),也是整個計算機行業(yè)的架構(gòu)技術(shù)。如何針對新興的服務(wù)器平臺、服務(wù)器技術(shù)和處理器技術(shù)的需求優(yōu)化存儲,使我們能夠在更小的整體空間內(nèi)確保更多的存儲容量和更快的存儲速度,從而提高分析速度呢?”
Crucial DDR4 DRAM 等美光內(nèi)存產(chǎn)品能幫助醫(yī)學研究技術(shù)縮短處理時間。 圖片來自 Dsimic。
在計算架構(gòu)上直接分析數(shù)據(jù)大約需要 5 納秒來完成處理。就處理時間而言,DRAM 與計算架構(gòu)極其接近,需要約 30 納秒。但隨著內(nèi)存解決方案越來越遠離計算架構(gòu),處理時間也隨之增加。SATA 固態(tài)硬盤處理同樣的數(shù)據(jù)需要 300 微秒,而 SAS 普通硬盤需要 6 毫秒。在遙遠的另一端,混合 SAN 需要整整 30 毫秒。
這看起來可能差別并不大,尤其是當這些數(shù)字僅是一秒的極小一部分時,但 Echols 建議用簡單易懂的說法來解釋它。如果在計算架構(gòu)中直接處理數(shù)據(jù)需要 1 秒,那么 DRAM 處理同樣的數(shù)據(jù)需要 6 秒。SATA 固態(tài)硬盤需要 16 個小時,SAS 普通硬盤需要 2 周,而混合 SAN 需要 2-3 個月。在這個層面,Echols 說:“這些速度極快的計算架構(gòu)等不了那么久。”
Echols 說:“美光科技的創(chuàng)新之處也正在于此。從 DRAM 到固態(tài)硬盤領(lǐng)域,我們在不斷創(chuàng)新。這是我們推動行業(yè)發(fā)展的貢獻所在?!?/p>
醫(yī)學的未來
Ansley 表示,美光科技助力精簡醫(yī)學研究技術(shù)的一個主要方式是:在更小的外形規(guī)格內(nèi)實施存儲解決方案,方便研究人員隨身攜帶。
Ansley 說,“尤其是在可能爆發(fā)特定類型病原體的第三世界國家/地區(qū),研究人員可能需要收集實時視頻掃描或超聲波掃描,即大量數(shù)據(jù)需要處理,所以他們更希望能夠把存儲數(shù)據(jù)握在手里而不是推在車里?!?/p>
Tony Ansley 認為,美光科技的內(nèi)存產(chǎn)品非常適合用來為移動醫(yī)療設(shè)備提供支持。圖片來自哥倫布空軍基地。
就像 MultiMAP 收集來自每個大腦神經(jīng)元的數(shù)據(jù)一樣,其他醫(yī)學技術(shù)也會收集海量數(shù)據(jù),從高分辨率的X射線圖到超聲波掃描圖文件中的數(shù)千兆字節(jié)的數(shù)據(jù),均是如此。研究人員需要能在現(xiàn)場隨時輕松獲取更多的數(shù)據(jù),避免不斷上傳和下載。因此,Ansley 說:“如果能將所有技術(shù)更高效地集成到越來越小的封裝中,我就能夠用手拿著而不用背在背上?!?/p>
他接著說道:“舉例來說,作為行業(yè)的一份子,美光科技始終在考慮如何將更多存儲集成到單個 NAND 芯片中。我們將 2.5 英寸硬盤或固態(tài)硬盤的存儲從過去的 100GB 擴展到了 10 到 20TB,而這僅用了短短幾年的時間,我們還將繼續(xù)努力。”