2018年10月25日,獲悉,AWS(亞馬遜網(wǎng)絡(luò)服務(wù))將加入NIH(美國國立衛(wèi)生研究院)STRIDES(發(fā)現(xiàn)、實驗和可持續(xù)性的科學(xué)和技術(shù)研究基礎(chǔ)設(shè)施)計劃,利用AWS云端的先進技術(shù)促進生物醫(yī)學(xué)的創(chuàng)新研究。
STRIDES計劃于2018年7月推出,旨在為NIH生物醫(yī)學(xué)研究人員提供商業(yè)云計算服務(wù)。最初,NIH的工作重點是幫助研究人員獲得高價值數(shù)據(jù)集,并嘗試用新的方法來優(yōu)化技術(shù)密集型研究。 STRIDES計劃是NIH共同基金數(shù)據(jù)管理新模式(NMDS)的組成部分,NMDS的另一組成部分是NIH數(shù)據(jù)共享測試計劃,該計劃旨在測試將高價值生物醫(yī)學(xué)數(shù)據(jù)集納入云計算系統(tǒng),建立和評估使用數(shù)據(jù)的最佳方法。AWS是繼Google Cloud之后加入STRIDES計劃的第二家云服務(wù)提供商。
AWS是亞馬遜的子公司,它以付費訂閱的方式向政府、公司和個人提供按需云計算平臺服務(wù),該服務(wù)始終允許訂閱用戶通過網(wǎng)絡(luò)訪問虛擬計算機數(shù)據(jù)集。
NIH與AWS達成的協(xié)議將幫助NIH研究人員以及全國2500多所學(xué)術(shù)機構(gòu)的研究人員獲得NIH的資助以及AWS的一系列技術(shù)。STRIDES項目的負責人希望通過與AWS這類的商業(yè)云服務(wù)提供商(CSP)合作提供的數(shù)據(jù)能夠達到生物醫(yī)學(xué)研究界認可的可查找、可訪問、可互操作和可重用(FAIR)的標準。
他們還希望AWS直接與NIH及其資助的研究人員合作,開發(fā)和測試新的方法,組建更多的數(shù)據(jù)集和相關(guān)的計算工具,供更廣泛的研究群體使用和訪問。CSP和NIH 數(shù)據(jù)共享測試階段的研究人員將為三個測試用數(shù)據(jù)集建立云存儲服務(wù),同時設(shè)置準則、制度和流程。在完成一系列試點計劃以及修訂該計劃的制度和程序后,這項服務(wù)將提供給NIH資助的研究機構(gòu)。
NIH資助的三個測試用數(shù)據(jù)集是基于他們在生物醫(yī)學(xué)研究界的價值、數(shù)據(jù)的多樣性以及基礎(chǔ)研究和臨床研究的覆蓋率而決定的。
目前,這三個數(shù)據(jù)集包括以下內(nèi)容:基因型——組織表達 (GTEx)數(shù)據(jù)集,GTEx數(shù)據(jù)集探索人類基因在不同組織中的表達和調(diào)控方式,以及基因組變異在改變基因表達中的作用;基因組資源整合(AGR),AGR數(shù)據(jù)集由6個MOD(模型生物數(shù)據(jù)庫)組成,MOD為模式生物的深度研究提供深層次的生物學(xué)數(shù)據(jù);精準醫(yī)學(xué)的Trans-Omics(TOPMed),TOPMed數(shù)據(jù)集收集并配對全基因組測序(WGS)。