小麥是重要的糧食作物之一。小麥基因組龐大、高度重復且為異源六倍體,使得小麥的完整組裝面臨挑戰。2018年,國際小麥基因組測序聯盟發布了中國春小麥參考基因組。但是,該基因組組裝存在大量未解析的重復區域和復雜序列結構,導致小麥基因組學研究難以全方位覆蓋整個基因組,阻礙了針對特定區域開展精細化研究,制約了小麥基因組學研究的發展和育種應用。
近日,中國科學院遺傳與發育生物學研究所傅向東研究組與魯非研究組,聯合中國農業大學科研人員,綜合利用ONT超長讀長測序、PacBio HiFi高精度測序和Hi-C數據,實現了中國春小麥基因組的近完整組裝(CS-CAU)。CS-CAU大小為14.46 Gb,堿基準確率大于99.9963%,僅剩290個組裝間隙。其中,1D、3D、4D、5D染色體首次實現無間隙組裝,1D和5D染色體達到端粒到端粒級別。
該研究解決了小麥基因組重復序列高、多倍體復雜的組裝難題,為解析其他復雜作物基因組提供了范本。基于近完整基因組組裝,研究共注釋到151,405個高置信度基因,其中59,180個是新注釋基因,包括7,602個首次組裝出的基因。通過整合RNA-seq數據集和跨物種蛋白同源性證據,研究解析了6類種子儲藏蛋白的基因組分布與表達特征。研究發現,ω-醇溶蛋白表達完全由B亞基因組貢獻,而其他5類SSP表達則主要由D亞基因組貢獻,為剖析小麥面筋品質的遺傳基礎和分子改良奠定了基礎。除chr1B的著絲粒存在與超長GAA重復序列相關的間隙外,其余20條染色體的著絲粒序列均全部組裝完成。對于著絲粒區序列組成進行分析發現,著絲粒區域主要由逆轉座子構成,其中A/B亞基因組著絲粒富含著絲粒相關反轉錄轉座子CRW和Quinta,而D亞基因組著絲粒中只有30%的序列為CRW和Quinta。相似的是,串聯重復序列在3個亞基因組間分布存在高度的不均勻性,其中71.89%的簡單串聯重復富集于B亞基因組,而接近一半的衛星序列則集中于D亞基因組。同時,研究解析了著絲粒區CRW和Quinta逆轉座子的插入時間,明確了其在3個亞基因組間的主要擴張時期。
上述研究為小麥遺傳改良和基礎研究提供了關鍵資源。
相關研究成果以Near-complete assembly and comprehensive annotation of the wheat Chinese Spring genome為題,在線發表在《分子植物》(Molecular Plant)上。研究工作得到國家重點研發計劃和國家自然科學基金等的支持。
論文鏈接
CS-CAU基因組下載路徑
中國春小麥基因組近完整組裝
本文鏈接:科學家完成中國春小麥基因組近完整組裝http://m.lensthegame.com/show-12-805-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任,僅提供存儲服務。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。