哈佛-麻省理工Broad研究所的科學家在Nature公布了60706名不同種族個體的外顯子序列。作為外顯子組聚集聯(lián)盟(Exome Aggregation Consortium ,ExAC)的成員,研究人員擁有最龐大的外顯子組資源,通過此次大規(guī)模樣本的分析,他們揭示了小數(shù)據(jù)集無法檢測到的變異特性。
為探索罕見病的致病突變打開新大門
ExAC是一個免費的、具有高分辨率編錄的人類遺傳變異數(shù)據(jù)庫,包含了上千萬個DNA變異——很多都是罕見變異,而且大多數(shù)為首次被發(fā)現(xiàn),它對罕見遺傳病的臨床研究和診斷有重大的意義。自2014年10月對科學界放開以來,ExAC數(shù)據(jù)庫的網(wǎng)頁在線瀏覽量已超過五百萬,使臨床醫(yī)生能為數(shù)千名罕見病患者提供更準確的基因診斷。
本文資深作者,Daniel MacArthur說,“ExAC的成功與多個聯(lián)盟的數(shù)據(jù)共享有關?!币郧暗馁Y源包含的外顯子更少,且沒有種族差異性,所以不足以應用至罕見病基因突變的研究中,他說,“ExAC數(shù)據(jù)庫的規(guī)模和多樣性是非常寶貴的,它使我們有能力發(fā)現(xiàn)極為罕見的突變,并為探索罕見遺傳病的根源提供了一個空前的窗口?!?/p>
來自世界各地的合作機構收集完數(shù)萬人的外顯子原始數(shù)據(jù)后,研究人員依賴于Broad研究所的分析和計算能力生成了分辨率前所未有的人類遺傳變異目錄——大約每8個堿基1個變異,大多數(shù)變異從未被報道過,且非常罕見,發(fā)生的概率為1/10000。
當掌握病人的基因組,臨床醫(yī)生便可將患者的任何罕見突變與ExAC數(shù)據(jù)庫進行比對,揭示基因或蛋白質中導致疾病的“禍根”。若患者的一些DNA突變在ExAC數(shù)據(jù)庫中極其罕見,但可能對蛋白質的形成有阻礙作用,那么這些突變極有可能是導致罕見病的關鍵因素。
Broad臨床研究測序平臺醫(yī)學負責人Heidi Rehm說,“ExAC資源對患者基因序列的臨床評估有很大的幫助。”在臨床測序中,許多DNA變異是罕見或未被研究的,因此我們無法確定它們是否對疾病風險有影響,在診斷和治療時也無法決定是否該將其考慮在內。通過參考ExAC數(shù)據(jù)庫中基因突變頻率,研究人員排除了那些常見的變異,這樣一來可以迅速鎖定真正致病的變異,避免良性變異帶來的不必要損失。 該資源還被研究人員用于確定多種新的罕見遺傳病。ExAC數(shù)據(jù)庫的長期用戶、威康信托基金會桑格研究所的研究人員Matthew Hurles說,“ExAC數(shù)據(jù)庫能夠讓我們使用新的統(tǒng)計方法來發(fā)現(xiàn)一些新型的嚴重性發(fā)育障礙?!盓xAC數(shù)據(jù)庫也正被研究人員用于探索基因變異帶來的更加根本的影響,例如探索轉錄因子蛋白的突變及其對蛋白質-蛋白質相互作用的影響。
提供新見解
有趣的是,本文數(shù)據(jù)提供了一些新的見解,一些預期中的突變在分析中未被發(fā)現(xiàn),一些基因含有比預期中更少的錯義突變?;诖笠?guī)模樣本,研究人員能夠量化每個基因中的這類突變,確定了多個在自然過程中被淘汰了的被“高度限制”的基因。由于不了解這些突變會導致何種疾病及其在ExAC數(shù)據(jù)庫中的實際例子,“丟失的突變”意味著這些被高度限制的基因可能導致一些嚴重的疾病。如果臨床或測序研究揭示這類基因在患者基因組中的功能缺失或錯義突變,那么該基因將成為患者強有力的致病候選因素。
ExAC數(shù)據(jù)庫還揭示曾經(jīng)報道的上百個致病突變實際上屬于良性,這將減少實驗室結果為假陽性的概率。該發(fā)現(xiàn)展示了ExAC數(shù)據(jù)庫在評估致病基因突變中的價值。