原文標題:The Trait Repertoire Enabling Cyanobacteria to Bloom Assessed through Comparative Genomic Complexity and Metatranscriptomics
發(fā)表期刊:mBio
分區(qū)/影響因子:生物學1區(qū),微生物學1區(qū),TOP,6.784
發(fā)表時間:2020年
第一作者:Huansheng Cao
通訊作者:Ferran Garcia-Pichel
第一單位:Department of Biological Sciences, Northern Illinois University, DeKalb, Illinois, USA
原文鏈接:https://pubmed.ncbi.nlm.nih.gov/32605986/.
文獻總結(jié)
自然選擇學說在分子生物學時代可以被描述為環(huán)境-基因的在漫長進化過程中的相互適應。
雖然這一觀點被普遍接受,但是需要更多的實證加以支持。
研究者嘗試從機制角度論證這個生態(tài)學中的基本問題,即環(huán)境會促進生物體在基因組水平的進化而這種進化能幫助生物體適應環(huán)境。
作者選用了藍藻作為研究模型,并且觀察到了基因組復雜性和生態(tài)位之間的聯(lián)系。
水華藍藻具有比非水華藍藻更加復雜且多樣的的偽空胞、藻毒素、脂肪酸合成、營養(yǎng)攝?。ò被帷⑻?、氮、硫)相關(guān)基因。
這種基因組復雜性和生態(tài)位的相關(guān)性或許正提供了生物體在不同環(huán)境脅迫下的差異性進化機制,并且可以推廣到生態(tài)學領(lǐng)域的其他研究。
文獻主要成果
(1) 基于不同原則的藍藻分類
首先,作者從NCBI中收集了43株藍藻(包括淡水藍藻和海洋藍藻)的113個基因組,其中包含45個水華藍藻的基因組和68個非水華藍藻的基因組。
之后依據(jù)16S rRNA序列相似度制作了進化樹,并根據(jù)產(chǎn)生水華與否(水華藍藻為藍色,非水華藍藻為紅色)和形態(tài)不同(Rippka分類,I:出芽生殖的單細胞藍藻;II:二分裂或多平面分裂繁殖的單細胞;III:無特化細胞的絲狀種類;IV:有異形胞無真分枝的絲狀種類;V:有異形胞有真分枝的絲狀種類)進行了標注。
然而,如果僅僅以是否能產(chǎn)生水華作為標準,不論是形態(tài)學分類還是16S rRNA同源性都不能很好地區(qū)分水華藍藻和非水華藍藻。
圖1基于16S rRNA基因序列的43株藍藻菌株的系統(tǒng)發(fā)育
注:水華藍藻為藍色,非水華藍藻為紅色。形態(tài)學分類則是根據(jù)傳統(tǒng)的Rippka分類。
(2) 藍藻相關(guān)代謝通路總覽
由于本文觀察的藍藻種系不同,因此如果簡單比較基因組的大小和序列,種系本身帶來的基因組差異必然會強烈干擾環(huán)境-功能互作帶來的基因組進化。
因此參考Aphanizomenon flos-aquae NIES-81基因注釋,作者從SEED和KEGG數(shù)據(jù)庫中收集并觀察了19個藍藻生存相關(guān)通路(稱為待查通路)和5個藍藻生存必需通路(稱為核心通路)。
作者猜想,環(huán)境導致的進化更多地應當出現(xiàn)在非必需通路(待查通路)。而已有研究表明生存必需的通路代謝通路在菌種之間相對保守得多(圖2)。
圖2 Aphanizomenon flos-aquae NIES-81中的信號通路
(2) 水華藍藻和非水華藍藻基因組復雜度存在明顯差異
作者對這些基因組復雜性加以定義,將基因注釋為蛋白質(zhì)后重點觀察了8項指標:
>NP(通路中的蛋白數(shù)量)
>NC(蛋白復合物數(shù)量)
>NPC(蛋白復合物中的蛋白數(shù)量)
>LP(通路中編碼所有蛋白的基因序列長度)>FLP(基因組中的LP占比)
>LC(蛋白復合物中編碼所有蛋白的基因序列長度)
>FLC(基因組中的LC占比)
>PC(某一藻種的NC在已報道的通路蛋白中的占比)
這些標定藍藻基因復雜性的8維數(shù)據(jù)首先被歸一化成0~1的數(shù),然后取平均作為基因復雜性指標(GCI)。
結(jié)果發(fā)現(xiàn),在待查通路中水華藍藻包含461(±57)個蛋白,在基因組中占比14.5;
而非水華藍藻僅僅包含274(±42)個蛋白基因組占比為10.3%。而作為對照的核心通路,水華藍藻和非水華藍藻之間沒有顯著差異(169,5.3%對160,6%)(表1)。
表1 水華株系與非水華株系核心與待查通路的復雜度比較
當具體到某些通路,5個核心通路、PSI和PSII在水華藍藻和非水華藍藻之間。
當然PSI和PSII在不同細菌中的地位是不同的,作為光養(yǎng)生物,PSI與PSII在藍藻中也許更應該被當做核心通路。
而其他各個核心通路,水華藍藻明顯比非水華藍藻具有更高的復雜度(表1和圖3)。
圖3 水華株系和非水華株系24條通路的平均相對基因復雜度(GCI)
(4) 基因復雜度和水華發(fā)生率存在正相關(guān)性
確定某一種藍藻能否引發(fā)水華僅僅依賴于NCBI的數(shù)據(jù)上傳者顯然是不夠嚴謹?shù)?,于是作者定義了特定藍藻的水華發(fā)生率(BII)。
各種藍藻的水華發(fā)生率數(shù)據(jù)來源于Web of science,具體方法是查詢菌株名稱(第一個),物種名稱(如果菌株名稱產(chǎn)生的結(jié)果不足),或者在少數(shù)情況下用屬名在網(wǎng)上檢索。從結(jié)果引用數(shù)大于2的結(jié)果中計算各個種系藍藻曾經(jīng)被報道發(fā)生水華的概率作為某一種藍藻的水華發(fā)生率。
將基因組復雜度和水華發(fā)生率進行相關(guān)性分析。
作者發(fā)現(xiàn)核心通路、PSI與PSII和水華發(fā)生率均沒有顯著的相關(guān)性(P>0.05)。
在待查路徑中,除了OSR、DrugR和MetalR外,所有路徑的相關(guān)性都很顯著。然而,只有7種途徑(vesicle,toxin,PUFA and AAT,CCM,sulfur,and osmosis)的R2> 0.4),只有2條附加路徑的R2>0.25(NF和N)(圖4A和B)。
具體地,基因組復雜度與水華發(fā)生率的相關(guān)性可以以Vesicle和Calvin為例體現(xiàn)出來(圖4C和D)。
圖4 每個通路中GCI和BII之間的Pearson相關(guān)性
通路的復雜性是由構(gòu)成這條通路的各個基因共同組成的。
作者將有顯著差異的vesicle路徑和沒有顯著性差異的OSR通路中的完整組分可視化。如圖5所示。在vesicle途徑中,所有基因在水華藍藻中都比非水華藍藻豐富(Wilcoxon sign rank test,P <0.05)。
對于OSR基因,只有g(shù)px在非水華藍藻中顯著高于水華藍藻(Wilcoxon sign rank test,P<10-2),而其他基因沒有差異(Wilcoxon sign rank test,P >0.05)。
圖5 根據(jù)水華能力排序,本研究的113個基因組中vesicle(A)和OSR(B)基因
(5) 待查通路復雜度在富營養(yǎng)水體中和表達水平存在相關(guān)性。
為了證實基因組復雜度在實際藍藻水華中是否真正有指示意義,作者在富營養(yǎng)化湖泊和寡營養(yǎng)湖泊中分別做了宏轉(zhuǎn)錄組研究,并把水華相關(guān)基因的復雜度和其表達量進行了相關(guān)性分析。
結(jié)果發(fā)現(xiàn),僅僅在富營養(yǎng)化湖泊中,水華相關(guān)基因的復雜度和其表達量存在正相關(guān)性。
這就構(gòu)建起了比較嚴密的邏輯關(guān)系:水華基因的更加復雜的藻種(GCI高)——導致水華——故而在湖泊中占比顯著上升(表達量高)。
藍藻水華高復雜度的vesicle、PBS、CCM和N也正是其高表達的通路之一,而OSR、metalR甚至MAA等非重要途徑的表達水平最低(圖6)。
圖6 表達水平與GCI的相關(guān)性:富營養(yǎng)化湖泊(Lake Erie,A 和 B;Harsha Lake,C 和D),寡營養(yǎng)化淡水湖泊(Sparkling Lake, E and F),寡營養(yǎng)化海水(western Arctic Ocean,Canada,G和H)
讀后
長久以來人們普遍接受環(huán)境壓力或者環(huán)境適應會促使生物發(fā)生進化,而其根本在于基因組水平的進化。
在自然狀態(tài)下基因會發(fā)生多種突變,產(chǎn)生各種表型而供自然選擇。
在這一過程中,發(fā)生基因的點突變或?qū)е略摶虍a(chǎn)物的表達和功能變化;而同源重組、復制異?;蚴腔蜣D(zhuǎn)座還會產(chǎn)生另一種形式的基因變異——基因重復,從而產(chǎn)生多拷貝基因。
多拷貝基因從個體上講僅僅是增加了基因的表達量,但是當把時間跨度擴大,多個拷貝的基因各自發(fā)生進化就會大大增加群體/物種的基因復雜度。
這種復雜度的提升幫助物種提高了對環(huán)境改變的應激能力。這也是為什么生物體中會大量出現(xiàn)結(jié)構(gòu)和功能相似但調(diào)控和活性又不完全相同的基因家族的原因。
而作為進化中的一環(huán),這種復雜度的提升理應更加容易地被環(huán)境選擇壓力所篩選出來。
因此,當我們講到具有更高環(huán)境適應度/更多功能的物種具有更高的基因組進化度/復雜度時,很容易就被大家所接受。
然而,本文作者則為這種朦朧的概念提供了確實的證據(jù),并且在環(huán)境中找到了實證。
這種創(chuàng)新可能是本文能夠被閃電接收并發(fā)表的重要因素(2020年5月12日投稿,5月26日即被接收,6月30日即見刊)。
此外,本文的數(shù)據(jù)為比較基因組學中的“相關(guān)性導致復雜性”提供了支持。
它描繪了一種將比較基因組學和生態(tài)學結(jié)合起來的工具。
在更廣的范圍內(nèi),本文的方法可以與宏基因組測序組裝的基因組相結(jié)合來推斷基因組復雜性和生態(tài)位之間的聯(lián)系,從基因和基因組層面挖掘和預測生態(tài)學問題,開辟一個全新的框架體系。
雖然這種方法適用于藍藻形成水華的情況,但原則上沒有理由不在其他微生物和生物類群中找到應用。