多重耐藥性(Multiple drug resistance, MDR)是一種微生物對多種抗微生物藥物表現出的耐藥性。能夠抵抗多種抗生素的細菌,即多重耐藥菌,對公共衛生和人體健康最具威脅。常見的多重耐藥菌有以下幾種:耐甲氧西林金葡菌(MRSA)、超廣譜β-內酰胺酶耐藥菌(ESBLs)、耐萬可黴素腸球菌(VRE)、耐萬可黴素金葡菌(VRSA)、多重耐藥性鮑曼不動桿菌(MRAB)、耐青黴素肺炎球菌(PRP)等。
下面我以一種常見的多重耐藥菌——鮑曼不動桿菌為例,介紹如何分析多重耐藥菌臨床菌株基因組重測序數據和比較基因組學分析。
鮑曼不動桿菌(Acinetobacter baumani, AB)屬於革蘭氏陰性菌,是一種嚴格需氧、非乳糖發酵的條件致病菌,不具鞭毛,移動性不高,但生命力極強,可廣泛存在於大自然中。AB是不動桿菌屬細菌中在醫院感染中最常見的一種,也是水產養殖業動物的常見病原菌。AB通常會引起菌血癥、肺炎、腦膜炎、腹膜炎、心內膜炎、以及泌尿道和皮膚感染。是一種重要的醫院病原菌,對免疫功能低下的患者構成嚴重的健康威脅。AB以其快速發展的多藥耐藥(MDR)能力,日益成為世界范圍內的研究熱點。為瞭在基因組水平上更好地瞭解AB的遺傳變異和耐藥機制,下面介紹8個臨床分離株(7個MDR菌株和1個藥物敏感菌株)的高質量基因組草圖,以及如何分析這些基因組的遺傳變異、序列類型和藥物敏感性。
首先通過藥敏實驗,檢測獲得菌株的耐藥譜,也就是咱們常說的菌株表型特征。一般整理為下面這種格式的表格:R代表抗性;S代表敏感。
在上面的表格中,可以發現使用的抗生素的名字(第二列)、抗生素的大類分類(第一列)。這些抗生素的中文名和英文名都很神奇,不容易記住。為瞭方便大傢查找,我歸納瞭一些常用的抗生素名錄:阿米卡星(amikacin)、阿莫西林(羥氨芐青黴素)(amoxicillin;AMC 30)、氨芐西林(Ampicillin)、丁胺卡那(Amikacin)、多西環素(Doxycycline)、復方新諾明(selectrin;trimesulf)、環丙沙星(Ciprofloxacin)、磺胺甲惡唑/甲氧芐啶(sulfamethoxazole)、磺胺異惡唑(Sulfisoxazole)、卡那黴素(Kanamycin)、利福平(rifampicin; rifampin)、鏈黴素(Streptomycin)、諾氟沙星(Norfloxacin)、強力黴素(doxycycline; vibramycin)、青黴素(penicillin)、慶大黴素(Gentamicin)、四環素(tetracycline)、頭孢氨芐(CL 30)(cefalexin)、頭孢拉定(cefradine)、頭孢曲松(ceftriaxone)、頭孢噻肟(Cephadantine)、頭孢西丁(Cefoxitin)、萬古黴素(Vancomycin)、新黴素(neomycin)、氧氟沙星(Ofloxacin)。
下面我介紹一下,如何分析細菌菌株基因組重測序數據。
在上面這個表中,有三個指標(N50; Scaffold number; Sequencing depth)特別重要,可以用來衡量基因組質量的好壞。這裡,我根據經驗,推薦下面常用的高質量基因組拼接閾值給大傢參考:N50 > 10 kb; Sequencing depth (X) > 200; Scaffold number < 50。這裡展示的8個基因組,N50和測序深度都不錯,拼接獲得的scaffold的個數也在50個左右,表明基因組的質量是可靠的。
獲得瞭基因組的基本註釋,包括基因預測、基因註釋之後,我們可以開始比較基因組分析瞭。這裡常用的一個分析是-Pangenome analyses。簡單的說,就是把所有菌株基因組編碼的所有蛋白質放在一起,進行聚類,展現蛋白質基因在每個菌株中的存在(presence)或者缺失(absence)的狀態。同時可以把這些基因分為三類:核心基因(core gene)【存在於所有菌株中】、分佈式基因(distributed gene/dispensable gene)【存在於兩個以上菌株中】、菌株特異性基因又稱為孤兒基因(strain-specific gene/orphan gene)【僅僅存在於一個菌株中】。核心基因通常也是細菌生長所需要的必需基因,在每一種細菌中,核心基因的數量可以通過回歸曲線擬合計算獲得,比如在我們這個例子中,下圖A中,隨著基因組數量的增加,核心基因的數量評估為~2000,而細菌的pangenome中基因的數量通常都是開放的,測序的菌株越多,pangenome中基因越多。
下圖展示瞭細菌泛基因組的結構特征(圖A)、COG功能分類(圖C)、基因在各菌株中的存在/缺失的狀態(圖B)。
03641dbe8f6eb68209c0a3e5e989abb5
在上面的熱圖中,咱們可以定性地判斷基因在特定菌株中的存在和缺失的狀態,但是一些蛋白質編碼基因通常在不同的臨床菌株中並不是100%序列相同的,可能序列同源性是95%、90%、85%。這些基因序列變異、同源性低的特征,往往預示著這些蛋白質具有多樣化的功能,使得菌株特定表型出現多元化的現象,尤其是一些結構蛋白,比如莢膜多糖生物合成基因簇中的一些合成酶、革蘭氏陰性菌的外膜蛋白等。所以,咱們可以把量化的指標“Sequence identity”,通過可視化的方法展示出基因組尺度蛋白組的序列變異情況,如下面的圈圖所示,可以更加直觀地發現相當於參考基因組的特征性的遺傳元件,除瞭發現缺失的基因,還可以觀察序列保守性低的基因或者操縱子。
b0761d8f045139c57e66960df76a8297
上面介紹的這些比較基因組學分析手段,不管對多重耐藥菌株,還是對具有特殊生理生化表型、不同毒力的菌株,都是常用的基因組遺傳信息解讀技術。對於一篇科技類文章來說,除瞭熱點的分析問題外,這些基因組尺度幫助我們全面觀察遺傳信息變異情況的分析也是必不可少的。
下面,我繼續介紹一下抗性基因如何分析,以及抗性基因型和菌株耐藥表型關聯的。通常,我們會掃描鑒定基因組中編碼抗生素抗性相關的基因、根據與抗性基因數據庫中的同源匹配信息,可以瞭解測序菌株中新發現的抗性基因、針對的抗生素、抗生素的大類從屬關系(如下表所示);同時可以檢測抗性基因是來自細菌染色體、還是可以水平轉移的質粒;檢測抗性基因是外源獲得性的,還是發生瞭點突變的細菌必需基因,比如rpoB、gyrA、gyrB等。
接下來,一般采用菌株的系統發育樹、抗性基因分佈的熱圖、菌株的多位點序列分型(MLST)等可視化的方式展示有關的生物學模式,如下圖所示,可以進一步比較分析抗性基因的分佈,檢測抗性基因是否具有序列型(ST)特異性、血清型特異性,或者其他分組指標的特異性。
a653b3e67b7e25b500213ae676c79493
此外,可以鑒定各種可移動遺傳元件及其分佈模式,包括轉座子Transposon、插入序列元件IS element、質粒復制蛋白,檢測這些可移動遺傳元件所在的基因組區域是否存在抗性基因,進而可以解釋這些抗性基因的外源獲得性。通常,我們可以采用線性的遺傳結構示意圖和菌株間同源序列可視化的方式,展示抗性基因和可移動遺傳元件之間的關系。
對微生物,尤其是細菌比較基因組學感興趣的老師或同學可以關註公眾號(微信號:ngsomics)與我聯系!
下一篇
來源:http://lbbonline.com近日,由FCB New York為百威旗下Michelob Ultra策劃的虛擬網球賽“McEnroe vs. McEnroe
花了3个小时整理,给大家说明白红三兵的基本形态,用法和陷阱,认真看完,少走弯路! 首先我们认识下红三兵,不是任意的三 ...