Genome Biol | 陳璐團隊利用完整參考基因組精細分析現代人基因組中尼安德特滲入序列

發布時間:2025-02-19瀏覽次數:90


隨著考古學和現代進化遺傳學等學科的交叉融合,尼安德特人和丹尼索瓦人等遠古人類基因組數據的有效獲取使得古人類與現代人類之間的基因混合研究成為可能。相關研究揭示了古人滲入序列在現代人類遺傳結構和進化適應中的獨特遺傳貢獻。前期研究表明,非洲以外人群基因組普遍攜帶約2%的尼安德特人DNA,同時,非洲人群也攜帶比以往認為的更多的尼安德特人遺傳成分[1]。此外,大洋洲的個體擁有約2-5%的丹尼索瓦人遺傳成分,亞洲人群中也有較少量的丹尼索瓦人基因序列。因此,準確鑒定現代人類基因組中的遠古人類滲入基因序列,對於理解人群混合中滲入序列的遺傳特征、功能特性、表型進化影響等至關重要。


然而,古人漸滲研究長期依賴於GRCh37hg19)人類參考基因組。但該基因組參考序列存在大量未組裝或組裝錯誤的基因組區域,阻礙了我們對於古人漸滲的全麵理解。T2T-CHM13作為首個完整人類基因組,填補了先前未測序或錯誤組裝的參考基因組區域[2]。因此,T2T-CHM13基因組的高度完整性為我們重新評估和深化現代人群中遠古人類滲入序列的理解提供了獨特機會。


2025217日,狗万外围充值 陳璐團隊和上海交通大學毛亞飛團隊合作在Genome Biology期刊上發表了文章A Refined Analysis of Neanderthal-Introgressed Sequences in Modern Humans with a Complete Reference Genome該研究表明,完整參考基因組T2T-CHM13在鑒定現代人群中尼安德特滲入序列方麵具有顯著優勢,並深入解析了T2T-CHM13特異性遠古人類漸滲信號及其基因組特性,並闡明了群體特異性古人遺傳變異對功能表型的全新影響



研究人員將阿爾泰尼安德特人和丹尼索瓦人的高覆蓋度基因組測序數據分別比對到GRCh37GRCh38hg38)和T2T-CHM13參考基因組,獲得三組古人基因組遺傳變異圖譜。進一步,研究人員利用陳璐團隊先前開發的IBDmix方法,基於1000 Genomes Project1KGP)中2504個非親緣個體遺傳變異數據以及古人基因組遺傳變異圖譜,分別鑒定了基於三個參考基因組的1KGP現代人群全基因組尼安德特滲入序列,並解析出T2T-CHM13特有的基因組漸滲區域與群體特異的適應性滲入信號,最終將基於三個參考基因組的現代人群中尼安德特滲入片段及適應性滲入信號編纂到數據庫網站ArcSeqHubASH, http://www.arcseqhub.com)(圖1)。

1 完整流程圖。


研究人員首先比較了不同參考基因組下古人測序數據的比對質量。結果發現,相較於GRCh38T2T-CHM13額外比對約1.9×10條尼安德特人測序讀段,全基因組比對率顯著提高,近端著絲粒染色體比對率從約80%提升至>95%Wilcoxon秩和檢驗顯示,T2T-CHM13提升了尼安德特測序數據的覆蓋均一性,顯著提高了測序數據的比對質量,同時,在丹尼索瓦人數據分析亦得出相同結論。


研究人員在檢測古人基因漸滲時,發現GRCh38T2T-CHM13版本的1KGP公開遺傳變異數據集采用的預過濾策略存在顯著差異。T2T-CHM13版本的1KGP公開數據集中采用的更嚴格的變異質量評分(VQSLOD)過濾了大量變異位點,從而在IBDmix算法邏輯下顯著減少了尼安德特人序列鑒定。因此,該研究統一采用GRCh38的預過濾策略,以確保高質量數據並避免過度過濾,強調了二代測序數據過濾策略選擇的重要性。


基於統一的遺傳變異數據預過濾策略,研究人員分析了在T2T-CHM13新鑒定出的尼安德特序列。結果發現相比於GRCh38,使用T2T-CHM13使得現代人群體中檢測到的尼安德特序列含量大約多出1Mb/人,新鑒定到尼安德特滲入的基因組區域共51.3Mb,其中1.68Mb位於T2T-CHM13“新解析”區域。


隨後研究人員進一步分析了T2T-CHM13新鑒定出的尼安德特滲入片段的產生原因。結果發現約75%的尼安德特漸滲新區域與4,196T2T-CHM13相較於GRCh38特有的組裝遺傳變異(插入、缺失、倒位)重疊,這些參考基因組組裝變異大小從10bp1.16Mb不等,足以影響古人數據的比對與變異鑒定質量。其中,T2T-CHM139號染色體上的~1kb插入變異(chr9_110M)使得該區域首次鑒定出尼安德特滲入序列,並且相關滲入序列廣泛存在於非洲以外人群(群體頻率大於5%)。有趣的是,該基因組區域與先天性重症肌無力綜合征相關的MUSK基因重合。


研究人員進一步分析檢測了群體特異的適應性滲入信號。研究表征了T2T-CHM1394個現代人特異高頻尼安德特單倍型,其中10個為全新發現的單倍型,包括2個非洲特異、2個非非洲共享、4個非洲/歐洲共享以及2個非洲/東亞共享高頻單倍型。相關單倍型包含代謝、離子通道、嗅覺及癌症等相關基因。以上研究表明了完整參考基因組可揭示新的適應性滲入信號,深化我們對人類進化與基因選擇的理解。


2 ArcSeqHub (ASH)可視化數據庫網站


最後,為利於古人漸滲相關研究,該研究還開發了一個集成GRCh37GRCh38T2T-CHM13尼安德特滲入序列的用戶友好型在線數據庫網站:ArcSeqHubASH, http://www.arcseqhub.com)。ASH提供“基因查詢”和“基因組區間查詢”兩種搜索方式,並能對尼安德特滲入序列、功能基因及人群/個體的漸滲比例等進行可視化展示。ASH中的相關原始數據均可免費下載。因此,ASH有助於醫學和進化生物學相關科研人員更為便捷地獲取和使用古人漸滲遺傳變異相關信息。


綜上,該研究提升了現代人類中遠古人類變異的檢測能力,強調完整參考基因組T2T-CHM13在古人漸滲研究中的應用價值,突出了針對具體研究場景選擇二代測序數據預處理過濾參數的重要性,提供了遠古人類滲入變異可視化數據庫,為解析古人類遺傳變異、功能及進化意義提供了新視角。


狗万外围充值 博士生梁申奧、上海交通大學研究生任天鑫和狗万外围充值 博士生張家瑜為論文共同第一作者。狗万外围充值 青年研究員陳璐和上海交通大學副教授毛亞飛為本文的共同通訊作者。本研究得到了中國科學院古脊椎動物和古人類研究所付巧妹研究員的重要支持。



參考文獻:

  1. Chen L, Wolf AB, Fu W, Li L, Akey JM. Identifying and Interpreting Apparent Neanderthal Ancestry in African Individuals.Cell. 2020;180:677-687 e616.

  2. Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, Vollger MR, Altemose N, Uralsky L, Gershman A, et al. The complete sequence of a human genome.Science. 2022;376:44-53.



狗万外围充值 陳璐研究組聚焦於人類遺傳和表型進化的基因組研究,運用群體遺傳學和計算生物學手段,結合新算法開發,解答“遺傳變異對人類表型及進化的作用及其機製解析”這一關鍵問題。主要研究方向一:遠古人類與現代人的人群混合及進化曆程;二:環境適應性及表型進化;三:疾病及複雜表型相關遺傳變異及其遺傳機製。研究組長期招收/聘具有計算生物學、生物信息學、遺傳學、進化生物學等多學科背景的研究生、博士後和研究助理。




Baidu
map