研究人员现在可以选择一种物理性状或表型,并通过使用称为表型 - 基因型整合体(PheGenI,发音为FEE-GEE-NEE)的新门户网站找到与其相关的基因组变体。
PheGenI允许研究人员查看基因组关联研究结果的表格显示,其中包括哮喘或糖尿病等特定性状的DNA序列变异,基因和基因表达差异。结果与他们的源数据库相关联,然后研究人员可以深入挖掘详细数据。
PheGenI还包括通过染色体(表意文字)的图形显示和DNA序列查看器,其显示核苷酸水平的人类基因组中的遗传变体之间的关系。
“PheGenI帮助建立对加速基础科学家遗传变异研究至关重要的知识库。它还将允许不熟悉此类数据的临床研究人员和流行病学家探索与他们研究的疾病相关的遗传变异和表型数据, “国家人类基因组研究所(NHGRI)人口基因组学办公室的流行病学家Lucia Hindorff博士说。Hindorff博士为PheGenI开发了这一想法,以响应美国国立卫生研究院越来越重视基因组医学。
与她的合作者Erin Ramos博士一起,也是NHGRI人口基因组学办公室的流行病学家,Hindorff博士与国家医学图书馆的国家生物技术信息中心(NCBI)的工作人员联系,建立了PheGenI。
PheGenI从多个NIH数据库中提取遗传和全基因组关联研究(GWAS)数据,并以紧凑,有组织的方式呈现给用户。提供的数据显示基因组中与用户指定的疾病或性状相关的位置,或者相反,与用户指定的基因组区域相关的性状。显示的数据包括物理特性,疾病,序列变异,基因和基因表达水平。数据来自提交给NCBI基因型和表型数据库(dbGaP)的遗传关联结果; 结合在基因型 - 组织表达项目(GTEx)中的数据; 和遗传协会发表在科学文献中,并由NHGRI 全基因组关联研究目录策划。
全基因组关联研究揭示了数千种与常见疾病相关的新型遗传变异,每种变异都会对疾病产生适度的风险。然而,来自此类研究的数据通常位于难以找到,操作或整合用于分析的不同数据库中。PheGenI用户可以探索变异,性状,表达水平和基因之间的关系,以了解当前研究揭示的对表型性状的遗传贡献。
根据Drs。Hindorff和Ramos为了将这些关于新变异的初步基本发现转移到临床中,研究人员需要进行大量的后续研究,以了解遗传变异的功能并确定那些最有助于疾病的变异。
“NHGRI和NCBI已经做了大量的前期努力工作,以便PheGenI对临床和生物医学研究界立即有用,数据可以访问和下载,”NCBI员工科学家Mike Feolo博士说。曾与NCBI员工科学家Douglas Hoffman一起帮助建立了PheGenI。
PheGenI用户能够通过表型,基因,染色体位置或遗传变异进行搜索,这些变体被称为单核苷酸多态性或SNPS。例如,对性状“哮喘”的搜索显示了88个遗传变异关联。如果用户向下滚动页面到“基因组视图”,他们可以看到每个SNP所在的23条人类染色体中的哪一条。进一步滚动,用户可以看到哪些基因与SNP相关联。
搜索结果中包含许多指向NCBI数据库中更多数据和信息的超链接,允许用户扩大或缩小对数据的探索。未来,其他专注于表型术语,复杂基因组变异和人类健康的数据库将被添加到PheGenI中。