近日,國際學(xué)術(shù)期刊《美國科學(xué)院院刊》(PNAS)在線發(fā)表了由中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院和美國斯坦福大學(xué)、清華大學(xué)等單位的科研人員合作的基因調(diào)控網(wǎng)絡(luò)建模的研究成果,提出了利用匹配的基因表達(dá)和染色質(zhì)可及性數(shù)據(jù)刻畫順式調(diào)控元件和反式調(diào)控元件相互作用的數(shù)學(xué)模型,將基因調(diào)控網(wǎng)絡(luò)的建模研究從編碼基因推進(jìn)到了非編碼區(qū)域的調(diào)控元件,有望用來注釋疾病等表型相關(guān)的遺傳變異。
分子生物學(xué)的中心法則指出了從DNA編碼基因到RNA再到蛋白質(zhì)的遺傳信息的流動方向。一個基因被轉(zhuǎn)錄為RNA時,人們稱之為“表達(dá)”?;蛘{(diào)控網(wǎng)絡(luò),即對基因表達(dá)水平進(jìn)行精準(zhǔn)控制的蛋白與DNA間相互作用?;蛘{(diào)控網(wǎng)絡(luò)是幾乎所有生物過程的核心。在特定的條件下,特定基因表達(dá)的啟動或停止,增強(qiáng)或抑制,是細(xì)胞選擇基因組中的調(diào)控元件和相互作用完成基本生命活動以及對外界刺激作出應(yīng)答的分子基礎(chǔ)。而且組織和細(xì)胞特異的基因調(diào)控塑造了不同的表型,是健康和疾病研究的基石。闡明基因選擇性表達(dá)所依賴的調(diào)控元件及其相互作用的分子機(jī)制,需要對基因調(diào)控進(jìn)行建模。特別是轉(zhuǎn)錄因子等反式調(diào)控元件和增強(qiáng)子等順式調(diào)控元件在特定的細(xì)胞環(huán)境下如何合作使得一個基因快速轉(zhuǎn)錄是基因調(diào)控網(wǎng)絡(luò)研究的核心問題。
來自中國和美國的科學(xué)家緊密合作,開展了對基因調(diào)控研究中的核心的元件(轉(zhuǎn)錄因子TF、染色質(zhì)調(diào)控因子CR和調(diào)控元件RE)之間的相互作用的研究,進(jìn)而對基因表達(dá)的定量預(yù)測進(jìn)行建模,發(fā)展了網(wǎng)絡(luò)推斷的新方法PECA。PECA重點(diǎn)對轉(zhuǎn)錄調(diào)控的三個關(guān)鍵環(huán)節(jié)進(jìn)行建模:一,基于CR與序列特異性TF的相互作用推斷CR在RE上的結(jié)合位點(diǎn);二,基于CR的結(jié)合和RE的可及性,預(yù)測RE的激活狀態(tài);三,基于激活RE上結(jié)合的TF預(yù)測目標(biāo)基因的表達(dá)。PECA推斷得到的條件特異的基因調(diào)控網(wǎng)絡(luò)可注釋數(shù)量性狀位點(diǎn)(QTL) 研究給出的非編碼區(qū)域的功能,從而對發(fā)生在非編碼調(diào)控區(qū)域的點(diǎn)突變和結(jié)構(gòu)變異與表型之間的聯(lián)系給出分子機(jī)理層面的解釋。該研究中利用了人類基因組計劃之后的“DNA元件百科全書”計劃 (Encyclopedia of DNA elements,簡稱ENCODE)中的數(shù)據(jù),特別是部分具有匹配的染色質(zhì)狀態(tài)和基因表達(dá)數(shù)據(jù)的細(xì)胞類型,解讀這些重要的數(shù)據(jù),將極大地促進(jìn)人們對后基因組時代基因調(diào)控網(wǎng)絡(luò)的理解。
領(lǐng)銜這項(xiàng)研究的斯坦福大學(xué)教授王永雄、中科院數(shù)學(xué)院研究員王勇、清華大學(xué)自動化系副教授江瑞分別得到美國國立衛(wèi)生研究院、中科院B類先導(dǎo)專項(xiàng)和國家自然基金委的經(jīng)費(fèi)資助。論文的第一作者是數(shù)學(xué)院博士生都仁扎那。