藏羚(Pantholops hodgsonii)是世居青藏高原的典型反芻動物,平均分布海拔3250-5500m,屬鯨偶蹄目(Cetartiodactyla),??疲˙ovidae),藏羚屬(Pantholops),是藏羚屬唯一物種。19世紀(jì)中期至20世紀(jì)初,猖獗的非法盜獵使藏羚的種群數(shù)量下降了約90%,2000年被世界自然保護(hù)聯(lián)盟(IUCN)紅色瀕危物種名錄評估為瀕危物種。經(jīng)過30多年的保護(hù),藏羚的種群數(shù)量恢復(fù)到了20多萬只,IUCN對其評級也從瀕危降為近危。藏羚不僅是世界上分布海拔最高的反芻動物之一,也是青藏高原唯一具有長距離遷徙行為的物種,是研究高海拔適應(yīng)性機(jī)制和遷徙行為的良好模型。然而迄今為止,公開數(shù)據(jù)庫中仍缺少藏羚高質(zhì)量的染色體水平基因組,嚴(yán)重限制了基于遺傳特征解析其物種適應(yīng)、進(jìn)化及種群生態(tài)相關(guān)工作的開展。
我校高原動物環(huán)境適應(yīng)與進(jìn)化研究團(tuán)隊與中國科學(xué)院西北高原生物研究所動物生態(tài)與資源保護(hù)研究團(tuán)隊合作,基于PacBio HiFi三代基因組測序、Hi-C測序和DNBSEQ-T7二代基因組survey測序三種測序技術(shù),成功組裝了藏羚染色體級別的基因組。結(jié)果顯示,藏羚基因組大小為3.1 Gb,Contig N50為84.6 Mb,所有基因掛載到30條染色體上(29 + X),與之前的核型研究一致。數(shù)據(jù)評估顯示,藏羚基因組BUSCO得分為98.2%(S:92.3%,D:5.9%,F(xiàn):0.8%,M:1.0%),平均QV值為70.14,表明組裝的連續(xù)性好,完整度和準(zhǔn)確性高?;贓DTA和RepeatModeler從頭預(yù)測的藏羚基因組中重復(fù)序列注釋結(jié)果表明,藏羚基因組重復(fù)序列主要由SINEs、LINEs、LTRs 和DNA transposons四種類型組成,序列總長度為1.65 Gb,占基因組的52.47%;基于蛋白同源預(yù)測、蛋白從頭預(yù)測和深度學(xué)習(xí)等多種策略,在藏羚基因組上共注釋到28,330個功能基因。
該研究通過多種技術(shù)手段,首次獲得了藏羚染色體水平的高質(zhì)量基因組和注釋信息,為藏羚的適應(yīng)進(jìn)化遺傳機(jī)制、保護(hù)遺傳學(xué)研究及進(jìn)一步探索物種遷徙行為的遺傳機(jī)制提供了重要的基因組資源。相關(guān)研究結(jié)果以A high-quality chromosome-level reference genome assemblyof Tibetan antelope (Pantholops hodgsonii)為題于11月12日在Nature旗下綜合性科學(xué)期刊Scientific Data(中科院二區(qū))在線發(fā)表。
供稿:科研院
【編輯:鄒林有 責(zé)任編輯:金萍】