亚洲精品私拍国产_国产日韩欧美亚洲综合专区_欧美v日韩v亚洲v最新在线_日本国产午夜福利精品在线_国产边打电话边被躁视频_自拍亚洲欧美另类动漫_melody免费观看高清_中文字幕在线日韩一区_91久久嫩草影院免费看网站_婷婷网色偷偷亚洲女人的

新聞動態(tài)News

藻資訊丨我國科研團隊組裝的造礁石珊瑚基因組被NCBI評選為主要標準基因組

發(fā)布日期:2024-11-10 14:41:06 瀏覽次數(shù):26


至2024年10月,NCBI (National Center for Biotechnology Information)已公布了上百個造礁石珊瑚(Scleractinian corals)基因組[1],其中組裝到染色體水平的基因組共有36個【桑格研究所(Wellcome Sanger Institute)提供了28個】。在這36個基因組中,經過NCBI多輪評估,共有29個被評選為參考基因組(Reference genome),但僅有5個被進一步評選為注釋基因組【NCBI RefSeq (Reference Sequence Database);即標準基因組,俗稱旗艦基因組】[2],作為全球石珊瑚研究的基因組背景。在這5個注釋基因組中,有4個是來自于東南大學數(shù)字醫(yī)學工程全國重點實驗室陸祖宏、何春鵬課題組的組裝成果。



從2022年開始,全球動植物基因組研究進入到了顛覆性變革時代。Wellcome Sanger Institute依靠PacBio HiFi (High-Fidelity)和Hi-C (High-throughput Chromosome Conformation Capture)聯(lián)用技術系統(tǒng)【部分結合ONT (Oxford Nanopore Technologies)測序技術】率先發(fā)起“總攻”,對上萬種重要的動植物基因組進行了地毯式的染色體水平測序組裝(很多組裝到了單倍型水平),涵蓋了系統(tǒng)發(fā)生樹(Phylogenetic tree)的所有重要節(jié)點,幾乎占領了所有的NCBI參考基因組[1]和注釋基因組[2]高地,迅速替代了大部分早期基于單一illumina二代測序技術所獲得的基因組數(shù)據(jù),在種質資源方面獲得了空前的基因數(shù)據(jù)“大盤”優(yōu)勢。


但與普通陸生動物不同,石珊瑚等刺胞動物具有與蟲黃藻等共生生物終生共生的特點,而且一種石珊瑚還經常與多種蟲黃藻同時內共生[3],因此石珊瑚基因組在DNA提取方面屬于典型的高污染基因組。再者,石珊瑚等海洋生物的基因組具有父母親本高雜合的特性。以上兩特性導致石珊瑚基因組是動物界中最難準確組裝到染色體水平的基因組之一。新興的HiFi測序技術雖然高效,但并不適合高污染、高雜合基因組的直接組裝。雖然HiFi測序數(shù)據(jù)的準確性在PacBio CLR (Continuous Long Reads)測序數(shù)據(jù)的基礎上提高了很多,但對于高污染或高雜合樣本,HiFi測序數(shù)據(jù)在直接組裝過程中會顯著增加將污染或雜合序列組裝進基因組的幾率。從2017年開始,陸祖宏、何春鵬及課題組的10多名科研人員針對石珊瑚基因組的特點和PacBio、Nanopore及Illumina等高通量測序技術的各自優(yōu)勢,制定出一套基于初評、測序、排污、組裝、注釋的多步技術方案,分離、排除了多種共生藻的干擾,最終得到了組裝質量較高的染色體水平的石珊瑚基因組。



陸祖宏、何春鵬課題組此次組裝的4種石珊瑚基因組分別為:美麗鹿角(軸孔)珊瑚(Acropora muricata, GCF_036669905.1)、葉形表孔珊瑚(Montipora foliosa, , GCF_036669935.1)、葉板薔薇珊瑚(Montipora capricomis, GCF_036669925.1)和疣狀杯形珊瑚(Pocillopora verrucosa, GCF_036669915.1)。以上4種石珊瑚均為印度洋-太平洋地區(qū)(Indo-Pacific region)珊瑚礁中的主要優(yōu)勢物種,其中A. muricata、M. foliosa和P. verrucosa來源于西沙島礁,為當?shù)氐某R娢锓N。Acropora是石珊瑚目(Scleractinia)的第一大屬,A. muricata是該屬的常見優(yōu)勢種。Montipora是石珊瑚目的第二大屬,M. foliosa是該屬的常見優(yōu)勢種,M. capricomis則因其絢麗的顏色而在石珊瑚水族箱養(yǎng)殖產業(yè)中非常受歡迎?,F(xiàn)生石珊瑚目可以分為Complexa和Robusta兩大分支,Acropora和Montipora屬于Complexa分支,Pocillopora屬于Robusta分支。Acropora和Montipora兩屬對于維持珊瑚礁表面活體層的碳酸鈣結構及生產能力至關重要。P. verrucosa是重要的礁前珊瑚,其分支粗壯,生長快速,個體直徑大,具有形成生物水下消波塊的能力。因此,這三個屬的石珊瑚對生物造礁、護礁、固礁至關重要,是海洋建設土交材建工程的良好補充,是實現(xiàn)海洋碳中和與負碳排放的中堅力量。

圖1. NCBI標準化基因組注釋流程[2]


RefSeq是由NCBI創(chuàng)建的一個高質量注釋基因組數(shù)據(jù)庫[圖1]。NCBI對基因組是否能夠被納入RefSeq數(shù)據(jù)庫有明確的篩選和評估標準。以下是能夠獲得NCBI注釋,成為RefSeq基因組的一些關鍵條件:






1. 高質量的基因組組裝結果


完整性:基因組必須具備較高的完整性,盡可能覆蓋整個基因組,避免大量的缺失或未解析區(qū)域。

連續(xù)性:基因組序列應當具有較高的連續(xù)性,較少的片段化(Scaffolding),并且優(yōu)選染色體級別的組裝。

低錯誤率:基因組序列應盡量少有拼接錯誤或測序錯誤,通常需要經過多次校對和糾正。

覆蓋深度:測序覆蓋深度應該足夠高,以確?;蚪M序列的準確性和完整性。





2. 物種的科學價值


醫(yī)學、農業(yè)或環(huán)境重要性:與人類健康、農業(yè)、生態(tài)環(huán)境相關的重要物種通常優(yōu)先獲得注釋。

模式生物:常用作研究對象的模式生物(如小鼠、斑馬魚、擬南芥等)往往被優(yōu)先考慮,因為這些基因組對科學研究具有廣泛的影響。

基因組學研究的基礎性物種:對于特定分類群或進化研究具有代表性的物種,尤其是某些物種的基因組首次測序,通常具有較高的優(yōu)先級。





3. 基因功能注釋潛力


已知基因注釋:基因組中包含已知基因或功能域,這些信息可以通過自動化或人工的方式進行準確注釋。

功能基因預測:基因組需要具有較好的基因預測和功能域注釋潛力,以便研究人員能夠進行基因功能研究。





4. 測序技術和組裝方法


先進的測序技術:基因組序列通常采用高通量測序技術生成,如PacBio或Nanopore測序,能夠產生高質量的長讀長數(shù)據(jù)。

優(yōu)化的組裝方法:基因組需要使用先進的組裝算法,確保序列的準確拼接,并生成高質量的組裝結果。





5. 基因組的公共可用性


公開數(shù)據(jù)提交:基因組數(shù)據(jù)必須提交到NCBI等公共數(shù)據(jù)庫,并確保科學界可以免費訪問和使用。研究者應將基因組數(shù)據(jù)提交至NCBI的GenBank或其他相關數(shù)據(jù)庫,確保數(shù)據(jù)的公開性。

元數(shù)據(jù)完整:基因組應附有完整的元數(shù)據(jù)信息,包括物種分類信息、測序平臺、測序深度、基因組大小、組裝版本等。





6. 與參考標準的比對


物種代表性:如果某個物種的基因組被選擇為RefSeq基因組,通常需要與其他物種的參考基因組進行比對和分析,以確保其準確性和生物學意義。

多樣性基因組的納入:對于某些物種,多個基因組版本可能會被注釋為RefSeq基因組,代表該物種的不同個體或亞種,反映遺傳多樣性。





7. 符合RefSeq的政策和標準


RefSeq有一套嚴格的政策和標準,特別是在注釋生物基因組時。這些標準涵蓋基因組的質量、物種的科學意義、測序和組裝的技術規(guī)范等。

NCBI RefSeq為研究人員提供了標準化、經過注釋和功能標注的參考基因組序列,具有廣泛的生物物種覆蓋,不僅涵蓋了人類基因組,還覆蓋了大量的模式生物、病原體、農業(yè)重要物種等,支持廣泛的基礎和應用研究。其主要作用數(shù)據(jù)優(yōu)勢包括:





主要作用


1. 基因組參考標準:RefSeq提供了高質量、經過人工和自動校對的基因組序列,作為生物基因組研究的標準參考。這為研究人員提供了一個可靠的基準,用于基因組比較、基因注釋和功能研究。

2. 功能注釋:RefSeq為基因組序列中的基因、轉錄本和蛋白質提供詳細的功能注釋,幫助科學家理解基因功能、調控機制以及與疾病的關系。

3. 跨物種比較:RefSeq不僅涵蓋人類基因組,還包括植物、動物、微生物等多種物種的基因組數(shù)據(jù),支持跨物種基因組比較分析。

4. 疾病研究:RefSeq在醫(yī)學研究中至關重要。它幫助科學家識別與人類疾病相關的基因變異,為藥物開發(fā)、基因療法和個體化醫(yī)療提供了基礎數(shù)據(jù)。

5. 數(shù)據(jù)整合與共享:RefSeq與其他NCBI數(shù)據(jù)庫(如GenBank、dbSNP等)整合,便于研究人員獲取不同類型的生物數(shù)據(jù),從而實現(xiàn)跨平臺的數(shù)據(jù)分析。





數(shù)據(jù)優(yōu)勢


1. 高質量和標準化:RefSeq中的基因組數(shù)據(jù)經過嚴格的質量控制和手動校正,確保數(shù)據(jù)的準確性和可靠性。相比其他數(shù)據(jù)庫,RefSeq具有更高的標準化水平。

2. 持續(xù)更新:RefSeq定期更新,確保最新的基因組數(shù)據(jù)和注釋反映最新的科學發(fā)現(xiàn)和研究成果。

3. 數(shù)據(jù)的可重復性和可追溯性:通過RefSeq,研究人員可以獲取標準化的參考序列,從而保證研究結果的可重復性。每個參考序列都有唯一的標識符,便于追溯和引用。

4. 易于訪問和使用:NCBI提供的各種工具(如BLAST、Genome Browser等)可以輕松地訪問和分析RefSeq數(shù)據(jù),方便研究人員進行查詢和比對。

5. 免費公開獲?。篟efSeq數(shù)據(jù)免費對公眾開放,任何研究人員都可以訪問和下載這些數(shù)據(jù),促進了全球范圍內的科學研究和合作。

6. 推進生物技術和基因工程:高質量的基因組注釋可以促進基因工程和生物技術的進步,例如通過基因編輯或基因合成等技術,進行生物制造、藥物研發(fā)或環(huán)境修復等應用。






總之,當一個物種的基因組獲得NCBI RefSeq注釋后,將具有更加廣泛的科學、醫(yī)學和應用價值。它提供了高質量的基因組參考,支持深入的基因功能分析和跨物種比較研究。同時,通過標準化的數(shù)據(jù)格式和持續(xù)更新,幫助提高研究效率,促進國際合作,并推動在醫(yī)學、農業(yè)和生物技術領域的應用。這些作用、優(yōu)勢和好處使得NCBI RefSeq成為基因組學領域的重要資源。


對于目前全球共生刺胞動物尤其是石珊瑚基因組的研究進展,何春鵬認為:雖然在國際科學界的共同努力下,取得了一定進展,獲得了一定數(shù)量的組裝質量相對較高的染色體水平基因組,但與小鼠、果蠅等模式生物和水稻、小麥等重要經濟作物相比,還存在一定差距,如親本單倍型基因組組裝和基因水平轉移(Horizontal Gene Transfer, HGT)現(xiàn)象確認等。古生物研究表明,石珊瑚與蟲黃藻之間的內共生關系至少從開始進行生物礦化之初,即在三疊紀安妮期就已經形成[4]。科學界在幾十年前就確信,經過至少2.4億年的漫長演化史,石珊瑚和蟲黃藻之間存在一定的基因水平轉移現(xiàn)象,即有部分蟲黃藻基因被水平轉移到了石珊瑚基因組中,造成石珊瑚具有一定的植物特性[5]。但相關現(xiàn)象一直沒有被準確的測序結果所證實,相關數(shù)據(jù)在上傳NCBI過程中一直得不到官方認可,被作為污染序列直接屏蔽或刪除。NCBI相關業(yè)務線負責人Linda Frisse博士認為,必須有更加準確的長讀長測序數(shù)據(jù)(Reads),如基于read N50≥200 Kb的高覆蓋度長讀長測序數(shù)據(jù)組裝出來的T2T (Telomere-to-Telomere)水平基因組(Contig N 50≥10 Mb),甚至是單倍型基因組,才能更好的準確解釋相關現(xiàn)象?;谏鲜鲈颍琋ature雜志資深編輯Michelle Trenkmann認為,盡管與十幾年前相比,相關領域的研究已經取得了巨大進展,但還未能徹底解決石珊瑚基因組的底層問題,仍然需要進一步的“硬”創(chuàng)新。目前,HiFi測序技術全面替代CLR測序技術是大勢所趨,超長DNA提取技術和超長ONT測序技術也在高速發(fā)展【基于早期ONT測序技術組裝出來的石珊瑚基因組[6]和其他共生刺胞動物基因組(如八放軟珊瑚基因組)并不成功[7]】。因此,在現(xiàn)有成果基礎上,首先對HiFi reads進行排污,然后與超長ONT reads進行混合組裝,再結合Hi-C技術進行輔助組裝,有望快速獲得T2T水平的高精度石珊瑚基因組[8]。在此基礎上,既可以進一步探討石珊瑚與共生藻之間的基因水平轉移、石珊瑚單倍型基因組等之前難以有效探索的生物學問題,又可以基于AI (Artificial Intelligence)生物制藥思維,依托新興的H100等GPU平臺和單細胞測序數(shù)據(jù),對石珊瑚進行更加深入的蛋白結構重建(AlphaFold結合冷凍電鏡技術)和細胞通訊(Cell chat)分析,找到與石珊瑚抗熱、生長及其他抗脅迫相關的關鍵生物學因素,運用細胞目穿透轉運和海洋緩釋技術予以干涉,增加珊瑚礁生態(tài)修復的技術效果。



對于動植物基因組的基因注釋信息獲取和更新,陸祖宏認為:目前仍過度依賴NCBI平臺,我國具有龐大的物種資源和生物信息分析需求,我國應加速發(fā)展自身的高通量長片段測序和基因注釋平臺,建立自己的測序數(shù)據(jù)存儲和評價數(shù)據(jù)庫。


該項目在執(zhí)行過程,在石珊瑚的基礎生物學特性、核型分析、生態(tài)分布等方面得到了廣州海洋實驗室、中國科學院南海海洋研究所張偲院士團隊、張躍環(huán)研究員團隊的大力指導和支持。


項目主要參與人員:陸祖宏、何春鵬、韓婷玉、黃萬龍、王冰、張偲、張躍環(huán)、陳均遠、廖馨、李一鑫、郭卓君、劉云卿、畢長偉、魯娜。

 

參考文獻

1. https://www.ncbi.nlm.nih.gov/datasets/genome/?taxon=6125

2. https://www.ncbi.nlm.nih.gov/refseq/annotation_euk/process/

3. Chen, B., Yu, K., Liang, J., Huang, W., Wang, G., Su, H., Qin, Z., Huang, X., Pan, Z., Luo, W., Luo, Y., & Wang, Y. (2019). Latitudinal Variation in the Molecular Diversity and Community Composition of Symbiodiniaceae in Coral From the South China Sea. Frontiers in microbiology, 10, 1278.

4. Stanley G. D., Jr (1981). Early history of scleractinian corals and its geological consequences. Geology, 9(11), 507–511.

5. Stanley G. D., Jr (2006). Ecology. Photosymbiosis and the evolution of modern coral reefs. Science, 312(5775), 857–858.

6. https://www.ncbi.nlm.nih.gov/datasets/genome/GCA_041430625.1/

7. Hu, M., Zheng, X., Fan, C. M., & Zheng, Y. (2020). Lineage dynamics of the endosymbiotic cell type in the soft coral Xenia. Nature, 582(7813), 534–538.

8. Hu, Y., Zhang, Z., Sun, S., Sun, Y., Huang, H., Zhou, W., & Wei, F. (2024). Toward the generation of pure coral genomes with experimental and bioinformatic improvements. Innovation, 5(4), 100643.


www.algaehub.cn

admin@algaehub.cn

長按掃碼訪問Algae-Hub網(wǎng)站

如需了解Algae-Hub研修班更多信息,請掃描二維碼聯(lián)系我們!

電話:19962541230

郵箱:caogeyi@metahub.cn