文獻解析——Nature | 六個具有參考價值的基因組揭示瞭蝙蝠適應的進化過程

文章名稱:Six reference-quality genomes reveal evolution of bat adaptations

發表期刊:Nature

發表單位:德國馬克斯·普朗克研究所等

發表時間:2020年7月

影響因子:42.778

研究背景

迄今為止,蝙蝠(翼手目)已確認超過1400種,約占現存哺乳動物物種的20%。蝙蝠遍佈世界各地,它們成功地占據瞭不同的生態環境。它們在全球的成功歸功於一系列非凡的適應能力,包括動力飛行、喉回聲定位、發聲學習、超長壽命和獨特的免疫系統,這可能使蝙蝠能夠更好地耐受對其他哺乳動物致命的病毒(如嚴重急性呼吸系統綜合征相關冠狀病毒、中東呼吸綜合征相關冠狀病毒和埃博拉病毒)。因此,蝙蝠是研究延長健康壽命、增強疾病耐受性、聲音交流和感官感知的重要模型系統。為瞭瞭解蝙蝠的進化和這些特性的分子基礎,本研究構建瞭六個蝙蝠物種的參考質量基因組,作為蝙蝠1K全球基因組聯盟的一部分,並與脊椎動物基因組項目合作,這六個蝙蝠屬涵蓋瞭陰翼手亞目和陽翼手亞目,代表瞭蝙蝠壽命的極端,與其他哺乳動物相比,蝙蝠對感覺的適應能力較強,能更好地在病毒感染下存活。

研究內容

1.基因組測序和組裝

為瞭獲得高連續性和完整性的基因組組裝版本,本研究應用瞭PacBio長讀長、10x Genomics,BioNano光學圖譜和和染色體構象捕捉(Hi-C)技術(圖1a)。使用一個稱之為DAmar的定制匯編程序將PacBio reads組裝成Contigs。接下來,研究使用10x,Illumina數據來糾正基本錯誤和相位單倍型。最後,使用光學圖譜和Hi-C數據來形成Scaffolds。本研究的所有六種蝙蝠物種,96-99%的序列是染色體水平的Scaffold(N50值為92—171.1 Mb)(圖1b)。與先前發表的蝙蝠基因組相比,本次研究具有更高的Contig N50值,范圍從10.6到22.2 Mb,這兩個數量級比僅用短讀數據組裝的蝙蝠基因組更為連續(圖1b)。同樣,本研究的基因組估計具有接近100%的基因完整性(圖1c,d)。此外,對197個非外顯子超保守元件的分析表明非外顯子基因組區域的高度完整性。本研究的這些基因組組裝質量可與迄今為止為任何具有千兆堿基大小基因組的真核生物生成的參考質量基因組相媲美。

2. 基因註釋

為瞭全面註釋蛋白質編碼基因,本研究整合瞭不同類型的遺傳證據,包括來自蝙蝠物種的RNA-seq和Iso-seq轉錄組數據,以及相關哺乳動物的蛋白和cDNA序列,和從頭基因預測(圖1c)。對於這六種蝙蝠,註釋瞭19122到21303個蛋白質編碼基因(圖1e)。使用BUSCO集合中的4104個哺乳動物基因,實現瞭99.3-99.7%的完整性(圖1d);這表明組裝的基因組和註釋在蛋白質編碼序列中高度完整。重要的是,本研究基因註釋的完整性高於狗、貓、馬、牛和豬的現有註釋結果(圖1d)。因此,本研究組裝的參考基因組與多種基因證據相結合,可以產生高質量和接近完整的蝙蝠基因註釋。這種策略可以推廣到其他物種,以改進基因組的組裝和註釋。

圖1 六種蝙蝠的基因組的組裝和註釋

3. 基因組大小和轉座因子

蝙蝠的基因組大小約為2 Gb,比其他胎盤哺乳動物的基因組小(通常為2.5—3.5 Gb)。通過註釋基因組中的轉座因子,發現較小的基因組大小與較低的轉座因子含量有關。與其他哺乳動物相比,蝙蝠基因組中最近插入的轉座因子在類型和數量上都極為不同。在蝙蝠身上,發現瞭最近的DNA轉座子類活動,而這些活動在其他哺乳動物身上已經潛伏瞭超過4000萬年。總之,蝙蝠表現出大量的轉座因子含量的多樣性,並且不同的轉座因子類別顯示出近期活動的證據。

4.翼手目的系統發育起源

確定蝙蝠在哺乳動物勞亞獸總目中的進化起源是進行任何比較分析的關鍵先決條件。然而,勞亞獸總目的系統發育,特別是蝙蝠的起源,是一個長期未解決的系統發育問題,因為多種系統發育和系統研究支持不同的拓撲結構。這些不一致的結果歸因於識別兩個(可能很短)內部分支的挑戰,這兩個分支連接著晚白堊世時期分化的四個關鍵分支,即翼手目、鯨蹄目、踝足目和(食肉目+食屍目)(圖2)。

研究利用瞭基因註釋的高度完整性,使用TOGA和10857個同源保守非編碼元素,從48個哺乳動物基因組中提取瞭12931個同源蛋白質編碼基因的綜合數據集。將這些數據集串聯起來,用ModelFinder確定序列進化的模型,使用帶IQ-tree的模型分區數據集推斷最大似然下的物種樹,使用大西洋獸類作為根,並獲得1000個引導復制來估計分支支持度。對於每個蛋白質編碼基因,將最大似然下推斷的最優基因樹與物種樹進行瞭比較,使用Robinson-Foulds距離來識別可能存在不正確同源性陳述的基因比對。對連鎖蛋白編碼基因的分析確定瞭勞亞獸總目蝙蝠的起源,在整個樹上有100%的引導支持(圖2)。從系統發育數據中省略得分最高的100和500個基因(基於Robinson-Foulds距離)產生瞭相同的樹拓撲,這表明同源性誤差對推斷的系統發育的影響很小。從保守的非編碼元素數據推斷出的樹確定瞭蝙蝠相同的系統發育位置。因此,基因組的編碼區和非編碼區都支持真盲缺目和其他勞亞獸總目之間的早期分裂。這棵樹挑戰瞭Pegasoferae假說,該假說將蝙蝠分為近爪類、食肉類和鱗甲目,但與之前對連鎖系統基因組數據的研究一致。102個反轉錄轉座子的進化研究考慮瞭不完全的譜系分類,也支持翼手目和猛獸有蹄類動物之間的姐妹群關系,但不同於目前的研究支持食肉動物和鯨蹄目之間的姐妹群關系。

接下來,考慮瞭本研究的數據和方法可能存在的系統發育問題。首先,隨著系統基因組數據集中同源位點數量的增加,bootstrap有時也支持錯誤的樹。因此,估計瞭15個分支樹的每個蛋白質編碼基因(n=12931)的最大似然支持度,這些分支樹代表4個關鍵分支的所有可能拓撲,真盲缺目作為外群,分支子樹如圖2所示。研究發現,最佳支持樹與連鎖蛋白質編碼基因集估計的樹相同(圖2),並顯示瞭翼手目和猛獸真有蹄類之間的姐妹群關系,這也由保守的非編碼元素支持。第二,模型的錯誤描述(由於系統發育數據與所用序列進化模型之間的擬合不好)或歷史信號的丟失會導致系統發育估計的偏差。為瞭評估這些因素是否影響瞭系統發育估計(圖2),研究又檢查瞭12931個蛋白質編碼基因的比對,以證明在同質條件下違反瞭進化假設(由這裡使用的系統發育方法假設),並作為歷史信號幾乎完全衰變的證據。共有488個基因比對,包括來自所有48個分類群的第一和第二密碼子位點,被認為是系統發育分析的最佳選擇,並被連接到數據矩陣中。生成最大似然樹,但導致系統發育估計不明確。因此,使用SVDquartets對這488個基因進行瞭單獨分析,SVDquartets是一種基於單位點聚合的方法,它提供瞭一種替代串聯的系統發育分析方法。推斷出的最優樹再次支持翼手目作為猛獸真有蹄類的姊妹群,這是所有分析和數據分區中最受支持的位置。綜合起來,來自全基因組的多條證據為翼手目作為有陰囊大目的基部提供瞭支持(圖2)。

8f0d839b42d9ea99d76176d61dd5ce04圖2 勞亞獸總目的系統發育分析

5.基因選擇、得失的篩選

利用最支持的物種系統發育學(圖2),探索瞭蝙蝠共有的特殊特征的基因組學基礎。對六種蝙蝠的基因變化進行瞭三次無偏全基因組篩選。首先,在aBSREL模型下,利用HyPhy篩選瞭12931個蛋白質編碼基因,這些基因被歸類為1:1的同源基因,用於蝙蝠祖先分支的正選擇標記。進一步要求在codeml中實現的分支站點測試獨立地驗證正選擇,並手動排除對齊歧義。這項嚴格的篩選鑒定出9個功能多樣的基因,它們在蝙蝠祖先中有可靠的正向選擇證據。這包括LRP2SERPINB6基因,它們與聽力有關。這兩種基因都在耳蝸中表達,在人類中,這兩種基因都與耳聾疾病相關。LRP2有一種氨基酸替代物,這是具有喉回聲定位的蝙蝠特有的,因為沒有喉回聲定位的翼足類蝙蝠表現出不同的衍生氨基酸。在第三個與聽力相關的基因TJP2中,分析發現瞭一個推測的微重復,這種微重復也隻在回聲定位蝙蝠中發現。使用公開的蝙蝠基因組(n=6)進一步證實瞭這些回聲定位特異性突變,並且使用嚴格的選擇協議發現,所有三個基因在非蝙蝠祖先譜系(即鯨目動物和食肉動物)中未處於正選擇狀態。如果這些突變和這些基因中選擇的祖先特征確實與回聲定位有關,這將提供分子證據,證明喉回聲定位在蝙蝠祖先進化瞭一次,隨後翼足類動物就消失瞭,而不是作為回聲定位蝙蝠內部的多個獨立獲取,為蝙蝠生物學關於回聲定位起源的長期爭論提供瞭信息。

除瞭聽力相關基因,全基因組篩選還揭示瞭幾種免疫相關基因的蝙蝠特異性選擇:B細胞特異性趨化因子CXCL13、哮喘相關的NPSR1INAVA,這是一種參與腸屏障完整性和增強巨噬細胞NF-κB信號的基因。這些基因的變化可能是蝙蝠對病原體的獨特耐受性的原因之一。通過用免疫和年齡相關基因本體論術語對2453個候選基因進行特異性測試,並嚴格要求aBSREL和codeml的顯著性,並進行多次測試校正,在蝙蝠祖先譜系中發現瞭10個額外的基因,這些基因具有強有力的正選擇證據。這些額外的基因包括參與免疫系統調節和NF-κB激活的IL17DIL1B,以及與病原體反應有關的LCN2GP2。進一步利用I-TASSER模擬瞭正選擇下基因編碼的所有蛋白質的三維結構,並估計瞭蝙蝠特異性殘基對蛋白質結構和穩定性的影響。結果表明,具有顯著支持正選擇的蝙蝠特異性替代物被預測具有穩定或不穩定作用,這可能會影響蛋白質功能。一些蝙蝠特異性的替換也發生在可能直接參與配體結合的區域或附近(例如,DEFB1、LCN2、SERPINB6KBTBD11)。總的來說,結合全基因組和候選基因篩選發現瞭幾個候選基因,這表明祖先蝙蝠進化出的免疫調節機制使其比哺乳動物更能耐受病原體。與此一致的是,重復嚴格的全基因組篩選來檢測食肉目和鯨目偶蹄綱祖先的可比較的、順序的分支的選擇,發現較少的免疫相關基因(食肉目和鯨目偶蹄綱分別有3個和4個基因)。

在第二次全基因組篩選中,使用瞭先前開發的方法來系統地篩選基因丟失。揭示瞭6種蝙蝠中有10個基因失活,但在大多數非蝙蝠的勞亞獸總目中也存在。其中兩個丟失的基因具有免疫刺激功能(圖3a)。LRRC70是廣泛表達基因強化多種細胞因子和細胞反應放大NF-κB激活介導的細菌脂多糖。IL36G中也是牛皮癬患者或炎癥性腸病,和編碼促炎癥白介素,誘發規范化NF-κB通路和其他促炎細胞因子。研究確認瞭這些基因在其他公開的蝙蝠基因組中的丟失(n=9)。總的來說,基因丟失和正向選擇的全基因組篩選揭示瞭參與NF-κB信號轉導的幾個基因(圖3b),這表明改變的NF-κB信號可能有助於蝙蝠的免疫相關適應。

第三,調查瞭基因傢族大小的變化,發現瞭35個基因傢族在蝙蝠祖先中表現出顯著的擴張或收縮。其中,推斷APOBEC3基因座的擴增(圖3c)導致瞭APOBEC基因傢族的擴張,眾所周知,在飛狐(狐蝠屬)以及其他哺乳動物中,存在著復雜的復制和丟失歷史。詳細分析表明,APOBEC3在蝙蝠祖先譜系中有一個小的擴展,隨後是涉及多達14個重復事件的多個譜系特異性擴張,包括在肌炎中產生第二個APOBEC3基因座。APOBEC3型基因編碼DNA和RNA編輯酶,這些酶可由幹擾素信號誘導,並與限制病毒感染和轉座子活性有關。APOBEC3基因在多個蝙蝠譜系中的擴增可能有助於這些譜系的病毒耐受性。

7c0597a4c17749b8f61f660d26c8a348圖3 全基因組篩選顯示瞭可能與蝙蝠異常免疫有關的基因變化

6.蝙蝠基因組中的整合病毒

越來越多的證據表明,由於免疫反應的適應性,蝙蝠比大多數哺乳動物更能忍受和生存病毒感染。研究發現的免疫相關基因的選擇和缺失以及病毒限制APOBEC3基因的擴增進一步支持瞭這一點。由於病毒感染會以內源性病毒元件(EVEs)的形式在宿主基因組中留下痕跡,因此研究對蝙蝠的基因組進行瞭篩選,以確定它們是否比其他哺乳動物含有更多數量和多樣性的EVEs。首先,主要關註的是非逆轉錄病毒,與內源性逆轉錄病毒(ERVs)相比,它們通常在動物基因組中含量較少。在蝙蝠個體和其他哺乳動物外群中鑒定瞭三個主要的非逆轉錄病毒科:細小病毒科、腺病毒科和博爾納病毒科。研究還在鼠耳蝠屬和伏翼屬中檢測到一種部分絲狀病毒EVE,這與之前的一份報告一致,即蝙蝠科類蝙蝠過去曾暴露於絲狀病毒感染並能存活。

其次,重點研究瞭所有ERV類的逆轉錄病毒蛋白編碼基因。與其他哺乳動物一樣,最大數量的整合來自β-和γ-樣逆轉錄病毒。值得註意的是,在幾種蝙蝠物種的基因組中,發現編碼病毒包膜(Env)蛋白質的DNA比其他逆轉錄病毒屬更相似。到目前為止,α-逆轉錄酶病毒被認為是唯一的內源性禽病毒;因此,在幾種蝙蝠物種基因組中發現的類α-逆轉錄病毒成分表明,蝙蝠已經感染瞭這些病毒。系統發育分析表明,大多數病毒整合是相對較新的整合事件。總的來說,這些結果表明蝙蝠基因組包含多種ERV,這為過去的病毒感染提供瞭證據。

7.非編碼RNA的變化

近年來,非編碼RNA在驅動表型適應中的作用已被證實,但對其在蝙蝠中的進化卻知之甚少。研究全面註釋瞭蝙蝠基因組中的非編碼RNA,並通過比較6種蝙蝠物種和42種其他哺乳動物來篩選非編碼RNA的變異(圖4a)。研究發現,幾乎所有帶註釋的非編碼RNA基因在所有六個蝙蝠基因組中都是共享的,以及蝙蝠和其他哺乳動物之間(例如,95.8%-97.4%在蝙蝠和人類之間共享)。考慮到microRNAs(miRNAs)作為發展和進化驅動力的重要性,專門研究瞭miRNA基因傢族的進化。在所有哺乳動物中鑒定出286個保守的miRNA基因傢族,其中11個在祖先蝙蝠分支中顯著收縮,其中13個丟失,與其他哺乳動物譜系具有相似的模式。

接下來,研究瞭單拷貝miRNA基因的進化。在6個蝙蝠和42個其他哺乳動物基因組中鑒定出的98個高度保守的單拷貝miRNAs的比對表明,與其他哺乳動物相比,一個miRNA(miR-337-3p)在蝙蝠的種子區有獨特的變異(圖4b)。從六種蝙蝠的大腦、肝臟和腎臟中的小RNA序列構建瞭文庫,並顯示miR-337-3p是普遍表達的。由於miRNA種子序列是靶特異性較強的決定因素,這些種子的變化有望改變蝙蝠miR-337-3p靶向序列的全序列。事實上,蝙蝠 miR-337-3p強烈抑制其同源的蝙蝠靶序列的表達,但對人類部位沒有影響(反之亦然)(圖4c),這表明蝙蝠特異性種子序列的變化改變瞭miR-337-3p結合的特異性。進一步探討瞭這種結合特異性的差異是否會改變所調控的靶基因集,並發現蝙蝠和人類miR-337-3p被預測調節不同的基因靶譜。對這些靶基因集的基因本體豐富性分析表明,蝙蝠的發育、節律、突觸和行為基因通路的調控發生瞭轉變,表明miR-337-3p調控的過程發生瞭顯著變化。

除瞭損失和變異之外,持續不斷的miRNA創新在真核生物日益復雜的組織出現中起著關鍵作用。為瞭鑒定蝙蝠進化出的新miRNAs(定義為具有新的種子序列),從所有六種蝙蝠物種的小RNA文庫中篩選出新序列。這一表達分析揭示瞭6個蝙蝠基因組中的122261個新的miRNAs,隻有一小部分被2個或更多的蝙蝠共享。從中鑒定出12種新的miRNAs,它們存在於所有6種蝙蝠的基因組中,並且在其他哺乳動物中也沒有明顯的同源性。為瞭測試這些候選基因是否是功能性miRNAs,選擇瞭前三個候選,並通過實驗測試瞭它們在報告者分析中調節理想靶序列的能力。測試的三個miRNAs中的兩個(miR-19125和miR-6665)能夠調節它們的靶點,這表明它們被內源性miRNA機制積極處理,裝載到RNA誘導的沉默復合物上,並且能夠抑制靶mRNAs(圖4d)。因此,miR-19125和miR-6665代表瞭真正的miRNA,它們是蝙蝠進化過程中的新奇事物。綜上所述,這些數據證明瞭蝙蝠譜系的創新,包括miRNA種子序列和新的miRNA出現。需要進一步詳細的機制研究來確定這些miRNAs在蝙蝠生理和進化中的作用。

圖4蝙蝠非編碼RNA的進化

研究結論

研究獲得瞭六種蝙蝠的染色體水平的、近乎完整的集合,它們代表瞭不同的翼手目譜系。利用對蝙蝠基因組的全面註釋和系統基因組學方法,探討瞭蝙蝠的進化起源,並將其作為猛獸真有蹄類的姊妹類群。研究對基因的獲得、丟失和選擇進行瞭保守的全基因組篩選,發現瞭新的候選基因,這些基因可能對蝙蝠的病毒感染產生耐受性。與這一發現相一致的是還發現蝙蝠基因組中含有高度多樣性的內生病毒。研究還發現瞭與聽覺有關的基因,這些基因表現出喉回聲定位蝙蝠特有的突變和祖先的選擇模式。如果未來的實驗表明這些變化確實與聽覺有關,這將支持翼足類蝙蝠喉回聲定位的單一祖先起源及其隨後的喪失。最後,研究鑒定並實驗驗證瞭miRNAs是進化上的新事物,或者在種子序列中攜帶蝙蝠特有的變化。這些重要的基因表達調控因子的變化可能導致瞭蝙蝠發育和行為過程的變化。

這些高質量的蝙蝠基因組,以及未來的基因組,將為研究蝙蝠適應和生物學的進化歷史和基因組基礎提供豐富的資源,這也是蝙蝠1K的最終目標。這些基因組有助於更好地理解構成蝙蝠特殊免疫力和長壽基礎的分子機制,使人們能夠識別和驗證分子靶標,利用這些靶標來緩解人類衰老和疾病。例如,研究預測蝙蝠的參考質量基因組將成為未來研究蝙蝠如何耐受冠狀病毒感染的重要工具。鑒於當前的2019年冠狀病毒病大流行(COVID-19),這具有特別的全球意義,並可能為提高人類生存能力提供解決方案,從而為當前和未來的大流行提供更好的結果。

參考文獻

David Jebb, et, al. Six reference-quality genomes reveal evolution of bat adaptations [J]. Nature, 2020.

发表回复

相关推荐

不好意思向亲友借钱,可以选择放心借

日常生活中,很多人碰到急需用钱的情况,都不好意思向亲戚朋友张口,一来是怕说出来了没面子,二来是怕没借到钱伤感情。其实 ...

· 34秒前

天心阁:古代兵家必据之地,长沙的标志性建筑!

天心阁位于湖南省长沙市中心地区东南角上,城南路与天心路交会之处的古城墙上,是长沙古城的一座城楼。

· 53秒前

《碧蓝档案》砂狼白子壁纸分享~(内含黑化白子)

白子黑化了,啊噗也已黑化,勿扰。 拿图赶紧走吧。 保存原图的方法如下↓↓↓ 手机党打开图片后,点击【查看原图】才能保存到壁 ...

· 1分钟前

儿童肠道健康功能“金指标”——解连蛋白和钙卫蛋白

上一篇文章我们介绍了人体肠道的4大功能,一副健康的肠道“功能齐全”,小朋友的身体机能、情绪、专注力都会有很大的改善。如 ...

· 2分钟前

东莞市各镇街面积人口经济一览表

东莞是全国5个不设县、区的地级市之一,所以它也没有县级一说

· 3分钟前