关键词:基因组;长读长测序;棉花基因组;
文献简介
- 标题(英文):The Gossypium herbaceum L. Wagad genome as a resource for understanding cotton domestication
- 标题(中文):作为了解棉花驯化的资源,印度棉(Gossypium herbaceum L. Wagad)基因组
- 发表期刊:G3 Genes/Genomes/Genetics
- 作者单位:德保罗大学、爱荷华州立大学等
- 发表年份:2022
- 文章地址:https://doi.org/10.1093/g3journal/jkac308
图1 文献介绍
亚洲栽培棉是一种原产非洲和亚洲的棉花物种,是2个已驯化的二倍体物种之一,全世界 95%的种植棉花都起源于此。为了表征棉花变异和提高基因组资源准确性,研究人员对亚洲栽培棉的第一个驯化品种 Wagad 进行了测序和组装。染色体水平的基因组通过联合 PacBio 长读长测序技术、HiC 和 Bionano 光学图谱以及与已有棉花参考基因组进行比较后得到。通过比较 Wagad 品种与野生品种基因组和转录组层面的差异,阐明了棉花基因组在驯化过程中的变化,这将为棉花育种提供新的见解。
测序流程
图2 亚洲栽培棉Wagad 品种与非洲亚种 13 条染色体基因组比对
研究者通过将PacBio 长读长数据进行组装后对基因组进行 repeat 和 gene 注释。然后,利用测序或者从公开发表文献中下载的棉花基因组数据进行比对、变异检测、联合基因分型对亚洲栽培棉和非洲亚种进行比较。此过程中,Sentieon DNAseq 模块被用于 illumina 数据的变异检测和联合基因分型。
图3 Sentieon 的作用
Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。
文献讨论
图4 文献结论
驯化是一个重要的进化过程,人类介导的表型变化导致无数(通常是匿名的)相应的分子变化。了解改良表型的分子基础是许多现代育种计划的基本目标,这些计划可能结合使用传统和尖端育种技术来加速作物改良。野生种质和驯化种质的比较可以提高我们对现代作物表型优势的分子基础的理解,并有助于我们理解如何利用野生种质来改良现代栽培品种(例如通过赋予抗病性)。
总结
综上所述,棉花是一种重要的纤维作物,经过多次独立驯化。在该研究中,研究者报告了亚洲栽培棉Wagad 品种的基因组序列。该序列补充了现有基因组组装和多样性研究,为了解棉花基因组结构和遗传多样性提供了基础,为二倍体棉花育种提供了额外的视角。