个体重测序揭示籼稻品种RGD-7S和Taifeng B的DNA多态性
广东省农科院研究人员携手千年基因,揭示水稻品种RGD-7S和Taifeng B的杂交后代F1在种植早、晚期先后出现杂交劣势和杂交优势的遗传基础。
研究背景
两个籼稻品种RGD-7S和Taifeng B的F1杂交后代在种植季的早期和晚期会分别表现出杂交劣势和杂交优势。为解释这一现象,研究人员对RGD-7S和Taifeng B进行了个体基因组重测序,通过分析这个基因组之间的变异,发现了杂交劣势、杂交优势出现的基因基础。
材料与方法
材料:RGD-7S和Taifeng B的基因组DNA;
测序平台: Illumina HiSeq 2000 100 bp PE
结果与分析
测序结果:
RGD-7S和Taifeng B的重测序数据量分别为14,973,227,780 bp 和15,457,502,782 bp,测序深度达到27.83X和28.72X,测序质量(Q30)分别为91.61%和89.92%。将测序数据比对至参考基因组粳稻Nipponbare,其覆盖度分别达到了85.5% 和 86.69%,这表明两个籼稻品种与粳稻Nipponbare之间存在着巨大的遗传差异,也反映出籼稻、粳稻亚种间经过遗传分化积累下的内在差异。
表1.两个籼稻品种HiSeq2000重测序数据及相对于粳稻覆盖度
SNPs和InDels:
通过与粳稻参考基因组比较,共得到了2,758,740个多态性位点,包括2,408,845个SNPs和349,895个InDels。其中RGD-7S共有 2,082,219 个多态性位点(1,744,556 SNPs,337,663 InDels) ,Taifeng B共有2 ,156,997 (1,821,644 SNPs,335,353 InDels)。在两个籼稻品种间发现了961,791个SNPs 和 46,640个InDels,其中10号染色体上的SNPs和InDels具有最高的变异频率,并且这些多态性位点多分布于基因间、上游、下游和内含子中,主要是由于这些区域在进化中选择压力较小,并且这些位点仅影响基因的表达,并不会影响基因的功能。
RGD-7S和Taifeng B之间的DNA多态性密度是每100 kb有256.8个SNPs和12.5个InDels,这一发现为发展分子标记及克隆杂交弱势基因提供了便利。
表2.品种RGD-7S和Taifeng B相对于粳稻基因组的SNPs及InDels的分布
表3.RGD-7S和Taifeng B之间DNA多态性的分布与频率
分析了SNPs在不同基因区域的的分布。发现其主要分布在基因的上游,下游、基因间,内含子,外显子等区域,比率分别达到了30%, 32%, 23%, 7% 和5%。
表4.不同区域变异的数量及比率
大效应SNPs可能会影响基因组的功能,以前的报道是在水稻中有2.7%的基因存在大效应SNPs。作者在分析了大效应SNPs及其分布后发现,两个品种有20%的基因存在达效应SNPs。
表5.大效应SNPs基因区域分布
在RGD-7S 和Taifeng B中检测到了大量的InDels,可以作为分子标记来定位杂交劣势基因。GD-7S有 349,895个 (177,194个缺失,172,701个插入),Taifeng B有352,336个 (174388个缺失,177948个插入) 。91%的插入和缺失集中在1-9个碱基(如2)。为了验证InDels作为分子标记的可靠性,作者设计了标记行了验证,大约71%的InDels经过了确认。
图1. RGD-7S和Taifeng B不同InDels大小分布
图2. RGD-7S和Taifeng B不同基因区域DNA变异比率
GO 分析
Taifeng B和RGD-7S基因的不同主要分布在细胞组分(9208 and 9236),催化活性(6319 and 6341),结合活性(6637 and 6658),细胞过程(7976 and 7982)和代谢过程(8682 and8675)(图 3)。丰度显著性分析表明Taifeng B and RGD-7S间不同的基因主要分布在相同的组内,如酶活性,糖结合,细胞蛋白修饰,核苷酸结合,信号转导,水解酶活性和应激反应。
图3. RGD-7S 和Taifeng B包含DNA变异基因的GO条目分布
图4. RGD-7S and Taifeng B不同基因丰度分布
拷贝数变异CNVs
拷贝数变异可以产生新的基因,改变基因量和改变基因结构被认为是基因组变异的主要来源,并且可能会影响表型遗传,基因表达与适应性。因此作者分析了RGD-7S和Taifeng B的CNVs,分别得到2727个与2010个 CNVs。RGD-7S在第9号染色体上CNVs最多,共819个。两个品种11号染色体上最少,RGD-7S和Taifeng B分别为49个和29个。
表6. RGD-7S和Taifeng B CNVs分布
结论
- 共得到了2,758,740 个多态性位点,包括 2,408,845个SNPs和349,895个InDels,DNA多态性密度是每100 kb有256.8个SNPs和12.5个InDels。
- 分别得到2727个与2010个 CNVs,在RGD-7S中,2,727个 CNVs中有1,989个重叠在218个基因中,在Taifeng B中2,010 CNVs中1,231个重叠在175个基因中。
- 验证了杂交弱势基因Hw3和Hw4中的InDel分子标记。
- 以上结果为解析杂交劣势和杂交优势基因奠定了基础。
相关推荐:
- NCBI在线BLAST使用方法与结果详解 2941
- 神经网络术语:Epoch、Batch Size和迭代 527
- Consed的安装与使用教程 465
- 陈连福的NGS生物信息学培训教材V2.1 277
- WGCNA分析使用教程 272
最新创建圈子
-
原料药研发及国内外注册申报
2019-01-25 10:41圈主:caolianhui 帖子:33 -
制药工程交流
2019-01-25 10:40圈主:polysciences 帖子:30 -
健康管理
2019-01-25 10:40圈主:neuromics 帖子:20 -
发酵技术
2019-01-25 10:39圈主:fitzgerald 帖子:17 -
医学肿瘤学临床试验
2019-01-25 10:39圈主:bma 帖子:58