近日,中國工程院院士、南方海洋科學(xué)與工程廣東省實(shí)驗(yàn)室(廣州)教授包振民團(tuán)隊(duì)開發(fā)國際首個(gè)整合宏觀/微觀進(jìn)化基因組和功能基因組的綜合分析工具(PanSyn,https://github.com/yhw320/PanSyn)。相關(guān)成果發(fā)表于《自然-實(shí)驗(yàn)手冊(cè)》。該成果是包振民團(tuán)隊(duì)長期積累的豐富基因組學(xué)分析方法和工具研發(fā)經(jīng)驗(yàn)的系統(tǒng)總結(jié)和提升。
闡釋基因組的結(jié)構(gòu)和功能是解碼地球生命史和生物多樣性的核心。高通量測序技術(shù)的革命性突破及各類組學(xué)技術(shù)的廣泛應(yīng)用,為生命科學(xué)領(lǐng)域帶來前所未有的發(fā)展契機(jī),推動(dòng)生命科學(xué)研究快速進(jìn)入大數(shù)據(jù)時(shí)代。深度挖掘復(fù)雜、高維度的海量組學(xué)資源已成為當(dāng)前生命科學(xué)領(lǐng)域面臨的巨大挑戰(zhàn)。對(duì)大部分生物類群(特別是非模式海洋生物)而言,至今缺乏深度系統(tǒng)的基因組學(xué)分析工具,難以滿足日益增長的對(duì)復(fù)雜海量組學(xué)數(shù)據(jù)的分析需求。

整合宏觀/微觀進(jìn)化基因組和功能基因組的綜合分析工具PanSyn流程概覽。受訪者供圖
基因組共線性分析為比較基因組學(xué)研究提供了基本框架。現(xiàn)存物種基因組間/內(nèi)和祖先與現(xiàn)存物種基因組之間的基因組共線性分析是闡明基因組結(jié)構(gòu)、調(diào)控元件及其進(jìn)化史的關(guān)鍵步驟。目前大多數(shù)共線性分析方法主要集中在微觀進(jìn)化尺度上,或僅在微觀或宏觀單一進(jìn)化尺度上進(jìn)行研究,鮮有對(duì)兩個(gè)尺度的綜合分析,嚴(yán)重阻礙了對(duì)基因組的泛進(jìn)化歷程及其背后蘊(yùn)藏的功能意義的全面理解。因此迫切需要開發(fā)一種全面且系統(tǒng)的比較基因組學(xué)分析工具,以深刻解析基因組結(jié)構(gòu)與功能進(jìn)化的本質(zhì)規(guī)律。
針對(duì)上述國際基因組學(xué)領(lǐng)域面臨的共性挑戰(zhàn),包振民團(tuán)隊(duì)開發(fā)了迄今最全面系統(tǒng)的整合宏觀/微觀進(jìn)化基因組和功能基因組的綜合分析工具PanSyn,其不僅包含功能全面的微觀共線性分析模塊,還極大彌補(bǔ)了宏觀共線性分析工具匱乏的局面,并創(chuàng)新提出整合微觀和宏觀共線性以及調(diào)控組學(xué)數(shù)據(jù)的集成式分析模塊。
與主流軟件和工具相比,PanSyn具有顯著優(yōu)勢(shì):一是,微觀共線性分析方面,可實(shí)現(xiàn)從單一到多重比對(duì)、從簡單到復(fù)雜倍性、從低維到高維網(wǎng)絡(luò)、從結(jié)構(gòu)到功能的全面微觀共線性分析;二是,宏觀共線性分析方面,可實(shí)現(xiàn)祖先基因組重建、古老基因家族聚類、核型保守性估算以及染色體進(jìn)化過程系統(tǒng)推斷;三是,整合分析模塊方面,首次提出從微觀到宏觀(自下而上)和從宏觀到微觀(自上而下)的雙重整合策略,實(shí)現(xiàn)祖先與現(xiàn)存物種之間的基因組泛進(jìn)化尺度的系統(tǒng)推演和解析。同時(shí)實(shí)現(xiàn)整合多維功能組學(xué)數(shù)據(jù),為理解基因組進(jìn)化提供更全面深入的功能解讀視角。
PanSyn是國際首個(gè)整合宏觀/微觀進(jìn)化基因組和功能基因組的綜合分析工具。PanSyn將為全面解析基因組進(jìn)化和功能、基因資源開發(fā)利用等提供有力工具,以助推生命科學(xué)領(lǐng)域的創(chuàng)新發(fā)現(xiàn)和重大突破,實(shí)現(xiàn)最終描繪出整個(gè)生命之樹的發(fā)展演變的全貌。
相關(guān)論文信息:https://doi.org/10.1038/s41596-024-00966-4