2月5日,中國農業科學院深圳基因組研究所合作研究成果在線發表于《細胞(Cell)》。該研究揭示了脊椎動物從水生到陸生進化歷程呈現三步式演化特征,并分析表明新基因的起源、新調控原件的出現、基因編碼氨基酸的改變這三類遺傳創新在脊椎動物從水生到陸生的演化過程中發揮了作用?;蚪M所阮玨研究員為并列第一作者,主要參與完成了非洲肺魚的基因組組裝工作。

脊椎動物從水生到陸生的轉變是脊椎動物演化史上的一次飛躍,這一過程需要在呼吸系統、運動系統、神經系統等方面進行各種生理和形態的革新才能實現。從硬骨魚祖先到肉鰭魚祖先、再到陸生脊椎動物各種進化改變的遺傳創新基礎是什么,一直是科學界懸而未決的重大科學問題。經過長期的古生物學和脊椎動物學研究,已知現在還存活的四足動物的最近魚類近親是肺魚。因此,解析肺魚和早期輻鰭魚類這些“活化石”魚類的基因組是解決這一重大問題的關鍵。肺魚擁有已知脊椎動物中最為龐大的基因組40Gb,是人類基因組3Gb的10多倍。肺魚基因組充斥著大量的重復序列,對研究人員解析其完整序列提出了極大挑戰。
阮玨帶領團隊參與研究優化wtdbg算法,高質量解析了迄今為止組裝難度最大的非洲肺魚基因組。團隊在原開發組裝方法wtdbg-1.2.8的基礎上,一方面大幅擴展了算法支持的數據容量,使其理論組裝最大基因組高達1000Gb,滿足所有已知生物的基因組組裝需求;另一方面進一步提高了算法的組裝速度,最終開發出組裝算法的新版本wtdbg2。使用wtdbg2算法,僅在3天內(192CPU)就完成了1.5TB的三代校正數據的分析,得到了39.1Gb的基因組序列(contigs),基于脊椎動物核心基因的BUSCO評估顯示其完整度高達95%。這一結果顯示出wtdbg2在攻克最大脊椎動物基因組解析研究中的巨大優勢。此次研究的非洲肺魚基因組不僅是目前最大的基因組,而且是首個完整且高質量的超大基因組,標志著我國科技人員在超大基因組解析方面已經達到國際頂尖水平。