服务名称: | 微生物基因组从头测序 |
规格: | 100 TESTS |
微生物基因组从头测序
微生物广泛存在于自然界中,与人类的生产和生活息息相关。微生物生物多样性丰富,基因组具有相对较小、重复序列较高、易于突变等特点,因此很必要对微生物进行全基因组测序,而且同动植物相比较在时间和成本上也容易实现。目前,全基因组测序成为微生物遗传进化、疾病预防控制、生物工程技术等方面重要的研究和开发手段。
一、技术路线
推荐平台:Roche 454 FLX+ 数据为主导,结合Illumina MiSeq和ABI 3730XL数据。
二、信息分析
1. 原始数据整理、过滤及质量评估
2. 基因组序列拼装与分析:
- 基因组序列拼装
- 基因组拼装效果评估(contig N50、scaffold N50、genome size and GC% )
- 缺口填补(gap finish)
- 比较基因组分析(基因组进化树分析、SNPs、共线性以及重复片段分析)
- 绘制基因组图谱
- 蛋白编码基因预测
- 非编码RNA预测
- CRISPRs预测
- 蛋白编码基因的功能注释
- 蛋白编码基因的COG和GO 注释
- 蛋白编码基因的代谢途径注释(KEGG pathway)
三、样品要求
1. 细菌:浓度≥200 ng/μl,总量≥50 μg,OD 260/280值介于1.8-2.0之间的细菌基因组DNA,并确保电泳检测无明显RNA条带,基因组条带清晰、完整,主带应在100 kb以上,DNA无降解,无污染。
2. 真菌:样品浓度≥200 ng/μl,总量≥50 μg,OD 260/280值介于1.8-2.0之间的DNA,样品浓度越高越好。真菌的de novo测序获得精细图,若基因组大小介于10~45 Mb之间,需提供至少100 μg的DNA,若基因组大小大于45 Mb,则需200 μg的DNA。
3. 样品保存期间切忌反复冻融。
4. 送样管务必标清样品编号,管口使用Parafilm膜密封。
5. 提供DNA电泳检测照片,用密封袋密封后随样品一起送样。
四、成功案例
微生物基因组从头测序
某细菌基因组
项目背景:基因组较大,GC含量高
研究目的:进行全基因组测序,了解基因组的全貌
测序数据展示
经典案例
案例1:卡他莫拉菌(Moraxella catarrhalis)菌株RH4从头测序
背景:卡他莫拉菌(Moraxella catarrhalis)是人类上呼吸道的条件致病菌,可引起儿童上颌窦炎、中耳炎、肺炎等,累及全身,是呼吸道感染的第3位常见致病菌,仅次于流感嗜血杆菌和肺炎链球菌。
目的:结合Roche 454、Illumina和ABI 3730XL三种测序平台绘制卡他莫拉菌菌株RH4的完成图。
结果:菌株RH4基因组由1,863,286个单核苷酸组成,并含有1,886个蛋白编码基因。比较基因组分析表明菌株RH4和ATCC43617的基因组高度保守。通过绘制卡他莫拉菌基因组完成图并进行基因组功能注释,为进一步研究其致病机制,研发新疫苗奠定了基础。
[ de Vries SP, van Hijum SA, Schueler W, et al. Genome Analysis of Moraxella Catarrhalis Strain RH4, a Human Respiratory Tract Pathogen. Journal of Bacteriology, 2010, 192(14): 3574-3583 ]
案例2 禾本科布氏白粉菌基因组测序
背景:布氏白粉菌(Blumeria graminis)是一种生长和繁殖完全依赖于宿主细胞的植物病原菌,目前许多性状的形成机理和机制还不清楚。
目的:利用Roche 454,ABI SOLiD和ABI 3730XL三种测序平台对布氏白粉菌进行全基因组测序,了解专性寄生营养方式等性状的遗传分子基础。
结果:布氏白粉菌基因组大小为120 Mb,包含5854个基因。它与宿主共生的原因是因为缺失一些关键基因,导致其无法合成破坏植物细胞壁的蛋白质。研究结果有助于了解真菌的特性,研究出防治植物病虫害的新方法。
[ Spanu PD, Abbott JC, Amselem J, et al. Genome expansion and gene loss in powdery mildew fungi reveal tradeoffs in extreme parasitism.Science, 2010, 10(26): 1543-1546 ]
五、常见问题解答
1. Q:微生物基因组测序的技术指标是什么?
A:微生物基因组测序按测序精度大致可以分为框架图、精细图和完成图三类。框架图要求基因组覆盖度大于95%,基因区覆盖度达到98%以上,单碱基错误率低于十万分之一;精细图要求基因组覆盖度大于98%,基因区覆盖度达到99%以上,单碱基错误率低于十万分之一,gap数不超过100个;完成图要求完整基因组序列,单碱基错误率低于十万分之一,gap数不超过5个。Q:如何使GC含量过高或过低物种的基因组测序达到相应组装标准? A:当GC含量大于65%或小于35%时测序难度均会增加,需要构建不同长度测序文库,并通过加大测序量才能够达到组装标准。
2. Q:如何完成基因组中重复序列数据的准确拼接?
A:通过构建不同长度测序文库并使用Roche 454 FLX+平台深度测序,可以对重复序列引起的错误进行校正。