中文引用格式: 徐勝超,楊波,王宏杰,等. 基于云計(jì)算的蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測[J]. 電子技術(shù)應(yīng)用,2024,50(8):10-16.
英文引用格式: Xu Shengchao,Yang Bo,Wang Hongjie,et al. Cloud computing based spatial structure prediction of protein folding[J]. Application of Electronic Technique,2024,50(8):10-16.
引言
蛋白質(zhì)定義為由共價(jià)鍵實(shí)現(xiàn)若干種氨基酸相連的多肽鏈,是生命活動不可缺少的重要物質(zhì)[1-2],因其高度參與,方使生命體具有活性[3]。分析蛋白質(zhì)結(jié)構(gòu)與功能對揭秘生物生命奧秘具有極其顯著的研究意義[4-6]。
蛋白質(zhì)分子具有較高的復(fù)雜度,直接通過能量函數(shù)確定蛋白質(zhì)分子能量與結(jié)構(gòu)的關(guān)系描述難以實(shí)現(xiàn)[7],因此,各種優(yōu)化算法應(yīng)運(yùn)而生。謝騰宇等人[8]為了準(zhǔn)確確定蛋白質(zhì)折疊空間結(jié)構(gòu),設(shè)計(jì)了兩步構(gòu)象空間搜索框架,該方法雖具有較好的局部搜索性能,但數(shù)據(jù)處理量很高,難以取得突出的數(shù)據(jù)處理效率。包晨等人[9]構(gòu)建的多尺度卷積和循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測模型能夠充分捕獲氨基酸序列局部以及長程特征信息,將其作為多層雙向長短期記憶網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)蛋白質(zhì)折疊空間結(jié)構(gòu)的確定。徐勝超[10]提出基于云計(jì)算的蛋白質(zhì)折疊模擬計(jì)算,研究了PERM算法的運(yùn)行流程和面向MapReduce的子任務(wù)劃分方式。上述方法在蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測上是可行的,但受優(yōu)化算法以及網(wǎng)絡(luò)訓(xùn)練參數(shù)量的影響,使得蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測計(jì)算量較高,面對龐大規(guī)模的數(shù)據(jù)處理量,如何提高算法執(zhí)行效率成為當(dāng)下急需解決的問題。
云計(jì)算技術(shù)采用虛擬化技術(shù),能高效地聚集多個(gè)物理節(jié)點(diǎn)并行化方式實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的高效處理,在高性能科學(xué)計(jì)算領(lǐng)域得到了廣泛的認(rèn)可[11-12]。因此,本文提出基于云計(jì)算的蛋白質(zhì)折疊空間結(jié)構(gòu)預(yù)測方法,本文云計(jì)算平臺的軟件在版本上比文獻(xiàn)[10]已經(jīng)提高了很多,在精準(zhǔn)獲取蛋白質(zhì)構(gòu)象的同時(shí)提高算法的運(yùn)行效率。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006114
作者信息:
徐勝超,楊波,王宏杰,毛明揚(yáng),蔣金陵,蔣大銳
(廣州華商學(xué)院 數(shù)據(jù)科學(xué)學(xué)院,廣東 廣州 511300)