Nature | 人類泛基因組計劃揭示基因組多樣性

原創 驕陽似我 圖靈基因 2022-05-01 11:07

收錄於合集#前沿分子生物學技術

撰文:驕陽似我IF:49.962推薦度:⭐⭐⭐⭐⭐亮點:人類泛基因組參考的目標是創建一個更復雜、更完整的人類參考基因組,以圖形為基礎,以端粒到端粒的方式表達全球基因組多樣性。本文利用技術創新、研究設計和全球合作關系,以構建盡可能高質量的人類泛基因組參考。本文的目標是改進數據表示和簡化分析,以實現完整二倍體基因組的常規組裝。隨著對倫理框架的關註,人類泛基因組參考將包含全球基因組變異的更準確和多樣性表示,改進跨人群的基因-疾病關聯研究,將基因組學研究范圍擴大到基因組中最重復和多態的區域,作為未來生物醫學研究和精確醫學的最終遺傳資源。

人類參考基因組是現代人類遺傳學和基因組學的基礎開放獲取資源,為比較研究結果提供一個集中的協調系統。它的發佈為基因組數據共享設置瞭標準,這對幾乎所有人類基因組學應用都至關重要,包括比對、變異檢測和解釋、功能註釋、群體遺傳學和表觀基因組分析。當前的人類參考(GRCh38.p13)是由20多個個體收集的基因組數據拼圖,其中約70%的序列由單個個體貢獻。依賴單個鑲嵌組合(不代表任何一個人的序列)會產生參考偏差,對變異發現、基因-疾病關聯研究和基因分析的準確性產生不利影響。 2022年4月20日,科學傢在nature雜志上發表瞭一篇名為“The Human Pangenome Project: a global resource to map genomic diversity”的前瞻性文章,概述瞭人類泛基因組參考聯盟(HPRC)的目標、戰略、挑戰和機遇。本文將讓科學傢和生物倫理學傢參與創建代表人類群體基因組多樣性的人類泛基因組參考和資源,以及改進組裝技術和開發基於圖形的基因組序列分析工具生態系統。這一新的參考將保持與原始參考的基本聯系,以保持連續性,即努力開發完整且無誤的人類基因組所有染色體的端粒到端粒(T2T)組合,這裡稱為“單倍型”。

7db10f9a9db58fe39d4f6aea170a33f8

“泛基因組”是代表物種遺傳多樣性的多個個體的整體基因組序列。HPRC通過多學科合作發揮作用,召集跨機構和多國工作組,致力於樣本收集和同意、群體遺傳多樣性、技術和生產、分階段和組裝、泛基因組參考構建方法、資源改進和維護、資源共享和推廣。HPRC包括幾個組成部分:收集:1000個基因組樣本開始該項目,隨後將通過社區參與和招募收集更多樣本。樣本選擇工作將確保基於圖形的參考捕獲全球人類基因組多樣性。序列:長讀和長程技術用於生成基因組圖,並在難以組裝的基因組區域填補空白。組裝:T2T完成的二倍體基因組將促進變異發現,尤其是在復雜、難以組裝的基因組區域。構造:可擴展的生物信息學方法組裝、質量控制、調用變量和基準圖組裝精度。該圖用基因描述和轉錄組數據進行註釋,使其更容易理解和解釋。利用:跨科學和利益相關者社區的合作將創造一個新的分析工具生態系統。臨床應用和研究使用將涉及結果的分析、驗證、解釋和公佈。推廣:HPRC推廣社區的成員參與並教育用戶社區,廣泛分享所有基因組產品和信息學平臺。ELSI:ELSI學者將制定選擇流程和政策框架,以滿足研究者的需求,並尊重研究夥伴的自主性和文化規范。圖1:HPRC的目標和戰略。

b92e12752c0fcd1bcb5ad7dbd85915fd

基因組學的技術進步使長重復序列測序、染色體物理定位以及母系和父系遺傳單倍型的分期成為可能。在項目初始階段,對單個個體HG002進行測序,其基因組序列已通過瓶中基因組(GIAB)聯盟進行瞭全面表征。評估瞭多種測序技術和組裝算法,以確定平臺的最佳組合,並開發瞭生成最完整和準確基因組表達的自動化管道。從現在已經確立的假設開始,即長讀(超過10 kb)產生的完整基因組組裝比短讀單獨產生的完整基因組組裝多。測試的技術包括Pacific Biosciences(PacBio)和/或用於生成重疊群的ONT長讀、10倍基因組學連鎖讀、Hi-C配對讀、鏈序列長讀和/或用於將重疊群支架化為染色體的BioNano光學圖譜。這項試點基準研究為測序技術和計算方法制定瞭標準,這對HPRC的成功至關重要。圖2:標準是通過對一個人的試點基準研究制定的。

科學傢正在構建一個包含三個互補部分的泛基因組參考:(1)單倍型,即輸入集合中的序列;(2)泛基因組比對是一個序列圖,是每個輸入單倍型作為路徑在該圖中的有效嵌入;以及(3)坐標系,這是一個向後兼容的坐標系和一組序列,使得能夠平等地參考參考中編碼的所有變化。單倍型提供瞭數百個基因組的個體代表,跨越瞭全球多樣性。每個單倍型組合將單獨用作研究與當前人類參考組合不同的基因組序列的參考。泛基因組比對表示各個裝配之間的同源關系。這種規范的比對將支持單倍型之間的坐標轉換(liftOver),並定義等位基因關系。它將成為許多新興泛基因組工具和管道的基礎,這些工具和管道將改善重要的基因組工作流程,例如,通過降低基因分型準確性對祖先的依賴性。坐標系提供瞭一種全局的、明確的方法來引用泛基因組中的所有變化。它使單倍型內的所有變異成為一類對象,可以平等地引用。最終,它將提供一種更完整的方法來引用未包含在現有線性引用中的變體,從而證明對基於泛基因組引用的數據庫和工具非常有用。圖3:人類泛基因組參考圖感知映射器可以通過直接映射圖來用於基因型樣本。

2c907e1ba2c8864ee6674272430d8d37

本研究的目的是記錄pangenome中人類基因組之間的遺傳相似性和差異。然而,即使有高質量的基因組組裝,全面的變異檢測仍然是一個挑戰。還沒有單一的數據類型或生物信息學方法在所有變異類別和基因組區域中實現高性能。因此,正在尋求多種互補的變異檢測方法,使用全基因組多組裝比對、成對組裝-組裝比對和傳統的基於參考的讀取比對的組合。 當前GRCh38參考的註釋包括基因和基因組特征,如重復序列、CpG島、調節區和染色質免疫沉淀-seq峰等。pangenome參考將具有這些相同的實用程序和更多功能,包括以下內容。對於基因,基因組分析中主要使用的兩個基因集是國傢生物技術信息中心(NCBI)的Ref-Seq,和EMBL-EBI的Ensembl/GENCODE。pangenome參考支持RefSeq和Ensembl/GENCODE基因集並把這兩個註釋映射到每個單倍型。基因組功能包括影響基因表達的調控區域、調節表達水平的增強子,以及控制細胞內染色體結構組織的三維相互作用。將利用現有的RNA測序、甲基測序和轉座酶可及染色質分析,以及來自路標表觀基因組學、編碼、4D核小體(4DN)、基因型組織表達(GTEx)和常見病基因組學中心(CCDG)等的高通量測序數據集,使用泛基因組參考來註釋此類功能信息。這將增強功能性人類遺傳變異目錄。將功能數據與pangenome參考相結合將有助於開發工具包和分析管道,以評估遺傳變異對復雜性狀和表型變異的影響。HPRC將與開發者合作,為數據提供商和消費者定義多模式“大生物數據”的規則和機制。 為瞭加強訪問和共享,將向AnVIL和國際核苷酸序列數據庫合作組織(INSDC)提交序列數據(PacBio HiFi、ONT和Hi-C等)、聯合體生產的組裝和泛基因組。數據也將在S3和谷歌雲存儲上存儲並公開。這個通用模型支持未來使用基於雲的策略進行跨多個中心的生物數據分析。全世界各種雲的用戶都知道他們使用的是相同的數據集。本文正在開發的資源和方法將對人類疾病和精確醫學的基因基礎研究產生深遠影響。雖然認識到臨床研究界的采用需要時間,但使用pangenome參考有三個重要的好處。首先,當對患者樣本進行測序和分析時,納入和顯示人類遺傳多樣性的更完整參考將產生更少的模糊映射,並對整個基因組中的拷貝數變異進行更準確的分析。這將改善基因診斷和變異的功能註釋。其次,該資源將有助於發現疾病風險等位基因和以前未觀察到的罕見變異,尤其是在標準短讀測序技術無法進入的區域。最後,pangenome方法代表著人類基因變異被發現方式的根本改變。 教授介紹:

王艇王博士是聖路易斯華盛頓大學醫學院Sanford C.和Karen P.Loewentheil的傑出醫學教授。王博士於1997年獲得北京大學本科學位。他在華盛頓大學獲得瞭計算生物學博士學位,在加利福尼亞大學聖克魯斯擔任Helen Hay Whitney研究員,之後又回到華盛頓大學,開始在遺傳學系和基因組科學和系統生物學中心開設自己的實驗室。王博士是國際公認的遺傳學傢,他研究轉座因子(TE)對基因調控的遺傳和表觀遺傳學影響。他的團隊以定義TEs對物種特異性基因調控網絡進化以及3D基因組結構保護的廣泛貢獻而聞名,並揭示瞭TEs的表觀遺傳失調是驅動腫瘤發生的主要機制。 王博士的實驗室通過整合尖端實驗和計算技術,研究正常發育和再生、癌癥和進化過程中細胞命運的表觀遺傳學決定因素。他的實驗室開發瞭廣泛使用的DNA甲基組學技術、識別調控基序和模塊的算法,以及整合大型基因組和表觀基因組數據的分析和可視化工具。他的實驗室是WashU表觀基因組瀏覽器的所在地,世界各地的研究人員利用該瀏覽器訪問由大型財團生成的數十萬個基因組數據集,包括NIH路線圖表觀基因組項目、編碼項目、4D核小體項目和目標項目。王博士目前領導NIH 4D核小體網絡數據協調與集成中心和NIEHS環境表觀基因組學數據中心。 參考文獻:Wang, T., et al., The Human Pangenome Project: a globalresource to map genomic diversity. Nature, 2022. 604(7906): p. 437-446.

发表回复

相关推荐

半導體物理——波矢與能帶

一、波矢在學習半導體物理和固體物理的過程中,我始終在疑惑一個問題,在這兩個科目中頻繁出現的波矢空間到底是什麼,當時老...

· 15分钟前

【筆記】托馬斯·阿奎那

*歡迎指出錯誤!(1)法律和正義托馬斯在信仰與理性的關系方面以及法律方面有一些獨特的觀點。1.共相問題共相問題的本質是信...

· 16分钟前

慧為智能:智能終端ODM制造商,佈局5G、AI等領域順應行業趨勢

(報告出品方/作者:開源證券,諸海濱,趙昊)1、公司情況:深耕智能終端產品,2021年營收上漲39%1.1、發展歷程:成立於2011...

· 46分钟前

刚刚拿到人力资源管理师证书,个人真实备考经历分享(踩雷避坑指南,3000字经验分享建议收藏!)

大家在考取各类证书之前是否都会先了解相关信息呢?报考条件、报名时间等等

· 46分钟前

最近相位分析:冥王刑火星——隐秘角落里的暗流

溪云初起日沉阁 山雨欲来风满楼 本月初火星已经和冥王星逐渐运行到90°,一个相刑的位置。并且这个相位要持续到10月底。火 ...

· 49分钟前