人类基因组研究所(NHGRI)召开研讨会,讨论大规模基因组学研究可以实质性解决的科学问题和机遇,并考虑未来NHGRI计划的选择区域。
研讨会强调了几个关注的重要科学机会。首先,使用基因组测序来确定人类疾病和健康特征(包括孟德尔病症和复杂疾病)的遗传变异,仍然是一项重要活动,需要大规模解决。其次,通过功能基因组学研究提高我们对变异影响的理解,对于了解基因 - 疾病关系至关重要。第三,仍然需要比较和进化基因组测序来告知遗传变异的优先次序和解释。第四,将基因组学转化为医学实践需要对测序的临床效用和临床实施方法进行批判性评估。最后,NHGRI应该培养“良性循环”
NHGRI需要继续支持所有这些领域的大量活动,同时促进跨领域的协调。在这些领域取得进展将需要NHGRI计划领域之间的协同工作,这些领域现在很大程度上是不同的。此外,由于项目与特定疾病和研究领域更加相关,NHGRI可能需要重新定义与其他研究所或资助者的界限和联系。这些机会为评估大规模测序工作的未来发展方向带来了激动人心的挑战。
NHGRI一直是创建本体和标准的领导者,并应继续在这一领域处于领先地位。鉴于世界上发生了大量测序,NHGRI可以采取措施对不同的测序工作进行编目,并确保以真正有用的方式共享数据。鉴于原始数据无法始终共享,因此提高互操作性和协作也很重要。通过这些类型的努力,集体序列数据成为每个人更强大的资源。
鉴于研讨会上发现的大量研究问题,NHGRI应该关注开拓性和催化性的方法。研究所无法解决基因组学中的所有问题,而应该定义和开发样本项目。这些项目应提供可以影响和加强大型科学界正在进行的研究的模型,方法和资源。此外,鉴于阐明人类疾病遗传基础所涉及的工作范围,NHGRI需要建立伙伴关系,整合并充分吸引相关科学专家,资金来源和社区。
介绍
2014年7月28日至29日,国家人类基因组研究所(NHGRI)召开了一次研讨会,以获取科学界关于NHGRI基因组测序计划未来发展方向的意见。参与者名单见下文附录1,NHGRI网站上有介绍。以前的GSP评估研讨会是在2009年。干预五年来,基因组学方面取得了许多进展:基因组测序的持续下降成本使得可以解决的问题的规模和范围成倍增加; 预计临床测序很快会使研究环境中产生的序列数据相形见绌; 新的功能研究方法正在出现,其中一些方法已经为大规模的努力做好了准备。这种不断变化和复杂的景观使得有机会根据2011年NHGRI战略计划提高思维,发现新机遇。
目前的GSP计划是大规模基因组测序和分析中心(LSAC),孟德尔基因组学中心(CMG),临床测序探索研究(CSER)计划和基因组测序信息学工具(GS-IT)计划。传统上,NHGRI GSP计划的特点是大规模,高度管理,以财团为导向的项目,在关注科学和医学相关研究领域的同时,产生社区资源和推进技术。优先考虑此类项目的新机会将确保NHGRI继续引领重要资源,技术,实验室方法,数据分析和其他基因组方法的开发。促进这些领域的进步对于促进我们对基因组生物学和改善人类健康的理解至关重要。
会议的目标是:
确定大规模基因组学研究可以充分解决的科学问题和机遇,从基因组测序开始,还考虑其他基因组技术。
考虑未来NHGRI计划的选项,以解决这些问题和机遇。
该研讨会的目的是作为未来方向的战略投入论坛,而不是对当前普惠制的全民投票。NHGRI特别感兴趣的是NHGRI旗舰计划的巨大机会; 关于研究所没有做什么但应该做什么的意见; 并讨论大规模,基于财团的追求的平衡和利益。最重要的是讨论疾病变异发现 - 与当前LSAC和CMG计划相关的领域 - 尽管研讨会还包括关于临床测序,信息学和分析以及功能基因组学的讨论,所有其他NHGRI计划感兴趣的领域(例如,GS-IT,CSER,功能基因组学等。与临床测序相关的领域,特别是CSER,将需要额外的长期规划,包括更广泛地考虑其他NHGRI基因组医学和道德,法律和社会影响(ELSI)活动。GS-IT在当前GSP中体现的基因组信息学还需要额外的计划,涉及数据科学和信息学的其他工作,包括NHGRI生物信息学组合和大数据知识(BD2K)计划(参见应用2的简要说明)本摘要中提到的美国国立卫生研究院[NIH]和NHGRI计划的网站链接。
会议议程分为三个主要部分。第1部分是关于当前NHGRI GSP科学的一系列演讲和讨论,包括NHGRI不应追求这些领域的后果。在第2部分中,分组讨论了NHGRI在未来五年内可以在四个科学领域实现的“重大挑战”的目标和策略:i)健康和疾病的遗传结构; ii)将基因组变异发现与功能分析相结合; iii)临床基因组测序; iv)比较和进化基因组学。第3部分重点讨论了NHGRI的选择,以实施有组织的,协调良好的科学工作,以解决会议早些时候提出的想法。还有五场“挑战会谈”(摘自应用4),发言人致辞:“
在研讨会开始时,NHGRI主任Eric Green博士指出,研讨会议程旨在引出雄心勃勃的想法,并认识到有许多机会和前进的道路。与NIH的其他部分和基因组学世界相比,NHGRI很小。为了最大限度地发挥其未来大规模基因组学项目的影响,NHGRI将需要开发合作伙伴关系,共同资助和成本分摊的模型。格林博士还指出,NHGRI将与国家人类基因组研究咨询委员会(NACHGR)协商,在NHGRI战略计划和更大的校外研究计划的总体背景下,将该研讨会的反馈纳入计划讨论。
本研讨会摘要分为三个部分:1)上面列出的科学领域,侧重于目标,战术和建议,2)从想法转向实施的计划性建议,以及3)在大型领域提出的其他跨领域主题和建议小组讨论。
第1节:科学领域的目标和建议
健康与疾病的基因结构
正如NHGRI战略计划所述,“基因组测序可用于确定从孟德尔病到常见复杂疾病的全方位疾病的遗传变异。” 达到这一目标还需要彻底了解等位基因频率和变异类型的全部范围。
迈克尔·博恩克(Michael Boehnke)提出的“发现赋予常见疾病风险的变种”
在接下来的五年中,我们应该致力于促进我们对人类疾病遗传基础的理解,并利用这些知识改善人类健康。
全基因组关联研究(GWAS)为理解与疾病相关的常见变异提供了丰富的经验和成功; 然而,所鉴定的变异仅解释了疾病遗传性的一部分,并且许多这些发现的生物学机制仍然是未知的。
大样本量对于检测与单一常见疾病相关的全谱遗传变异至关重要。合理的起始估计是样本量为25,000个病例和25,000个对照。
仔细选择合适且新颖的研究设计也是最大化功效的重要方法。
由于频率,严重程度或成本负担,许多人类疾病引起我们的注意。对有限数量的示例性疾病进行优先排序可能包括:大量表现良好,广泛同意的个体; 组织的调查小组,拥有数据共享和协作的记录; 和其他资助者的财政支持。
NHGRI未能继续在这一领域失去机会。更加分散的努力将减缓进展,并导致更少的数据和信息共享,包括更少的数据互操作性。
“发现孟德尔疾病的基因组基础”由罗德里克麦金尼斯提出
孟德尔条件很少见,但总的来说它们对人类健康产生了很大的影响,影响了超过2500万美国人,每个受影响人一生都要花费500万美元。
确定所有孟德尔条件下的突变 - 其中绝大多数是功能丧失 - 的目标是人类等同于小鼠敲除项目,并且对于理解人类生物学和基因组医学非常重要。
NHGRI CMG已经证明了使用表型驱动和基因型驱动方法进行疾病基因发现的高通量测序的能力。这项工作可以进行诊断和预测性测试,并提高我们对多效性和遗传异质性的理解。
在分子水平上诊断孟德尔病症对患者及其家属是有益的。了解疾病的遗传学和生物学,可以提供更准确的遗传咨询,并有可能改善预防,预后和靶向治疗。
尽管CMG迄今取得的进展令人印象深刻,但仍有大量超过3,700种孟德尔条件的遗传基础。多达17,000个基因仍然是孟德尔条件的候选者。
了解孟德尔条件有助于我们对复杂疾病的理解,并且鉴定孟德尔病症的基因可能导致适用于更广泛患者的药物靶标。
会谈,分组和讨论的目标,机会和建议包括:
定义基于人类疾病和健康特征的基因型 - 表型关系,作为阐明病理生理学以及所有人类基因和功能序列的基本分子,细胞和生物功能的手段。
NHGRI的作用是推进范式,开发和评估方法和工具,建立基础资源,并促进与分类机构和其他相关方的伙伴关系。
NHGRI无法研究所有常见疾病; 相反,努力应该集中在代表健康和疾病相关表型谱的“范例”条件上。应选择表型以跨越一系列疾病分类:罕见和常见疾病; 儿科和成人病情; 和精神病,新陈代谢,发育和传染病。应考虑分子,中间和临床表型。应该包括不同种群的人口。应选择实例以实现多种研究范式的测试和开拓,例如评估不同的研究设计,“其他组学”的作用,以及外显子组与全基因组方法的比较。
常见疾病的范例研究需要大样本量。电力充足是不够的; 这些研究需要很高的功效来发现疾病亚型和跨等位基因谱中的疾病相关变异。最好是进行少量全面,高效的研究,而不是通过大量动力不足的研究做出妥协。应该考虑新颖的设计和提高功率的方法(NB Nancy Cox在她的挑战演讲中提出了一个新颖设计的例子。见App.4)。
NHGRI应继续为孟德尔和复杂疾病培养出至关重要的卓越品质。需要不同的方法和专业知识,因此不应将这些方案结合起来。但是,这些方案也应该不是孤立的,应该进行协调和整合,以促进协同方法和科学进步。
孟德尔和复杂疾病落在频谱,并且有值探索遗传体系结构的全分集,包括由引起的疾病从头基因组的事件,与不完全或可变外的表型,并用遗传和环境条件改性。
NHGRI需要在纵向队列中开发和支持测序,以用于发现和临床测序。理想情况下,测序将在一群表型良好的个体中进行,这些个体随着时间的推移随后得出结果,并且随着新信息的出现,可以重新接触更深层次的表型。
创建并广泛提供解释生命科学,药物发现,临床预测和诊断中基因组序列变异所需的知识库。
NHGRI应继续作为数据汇总和共享的领导者。这需要适当承认数据科学,生物信息学和工程方面的所需投资,以及对数据安全和隐私的适当认可。
利用全世界生成的大量序列数据,需要新的数据库基础设施模型,以促进数据和信息共享,包括序列,表型和持续的临床信息。虽然强烈需要采取行动,但一些与会者告诫不要对单一数据公共模型过早达成共识,而是支持实现和评估多个可互操作模型的联邦模型。全球基因组学与健康联盟(http://genomicsandhealth.org/)正在这一领域开展工作。
一个目标是了解功能丧失变异对每个基因的影响,包括可以被敲除而没有明显不良反应的基因。尽管模式生物中的工作仍然很重要(参见下面的比较基因组学),但并非所有人类基因都具有其他生物体中的等同物,并且某些效应对人类具有特异性。这也应该解决仅在暴露于其他因素(基因修饰物,药物基因组学变体,基因 - 环境相互作用等)时显示出效果的变体。
国内和国际“媒人”服务可以将患者(及其医生)与具有相似遗传变异和表型的其他患者联系起来。其他服务(例如,由Baylor-Hopkins CMG开发的GeneMatcher)可以将研究人员与财团联系起来。这种联系有助于发现和临床应用。这些服务需要医生直接识别和交互,并与其他测序工作(包括由NHGRI赞助的那些测序工作)互操作。
NHGRI应鼓励提供额外资源,提供等位基因频率数据,标准化注释以及有关人类基因组变异的其他相关聚合信息。
包括一系列人类疾病和人口疾病,以扩大发现,定义建筑,扩大获取和社会公正问题。
NHGRI需要继续促进人口,种族和种族的良好动力研究,以尽量减少谁从发现和临床测序中受益的差异。关注广泛同意的个人可能会限制多样性,因此NHGRI需要寻求新的方法来确保平衡。
对跨越人类多样性的多个群体的研究允许更好地理解等位基因谱和疾病的遗传结构。一个群体中的罕见变异可能在其他群体中很常见或不存在。通过利用人口和疾病遗传结构,我们可以更好地阐明特定变异和基因与疾病的关系。
将基因组变异发现与功能整合
正如NHGRI战略计划中所讨论的,继续获取基因组功能知识对于理解基因组的生物学和疾病的基因组基础是有价值的。将变异发现与基因组功能分析相结合可以帮助预测以下因素:基于已鉴定标签变体的因果变异; 靶基因和基于疾病关联的细胞类型; 和致病变体起作用的机制。
Joseph Ecker介绍的“大规模功能基因组学”
功能基因组学的长期目标是破译基因和基因网络受到调节的规则,并了解这种调节如何影响细胞功能,发育和疾病。
现有的测序程序没有大规模检查功能; 然而,一些现有的和即将到来的NHGRI(ENCODE,GGR,FunVar)和美国国立卫生研究院共同基金(路线图表观基因组项目,GTEx,LINCS)计划正在为我们的基因组功能的认识作出了重要贡献(见附录2)。
一个挑战是调节元件可以长距离作用,这意味着调节变体不一定靶向最近的基因。有机会大规模地描述远距离染色质相互作用和调节,以了解基因与其调节元件之间的连通性。
有希望的新兴基因组编辑方法,例如CRISPR / Cas9,可以允许对分子和生物表型(包括疾病)的变体功能进行快速和新颖的评估。
最近关于金发颜色分子基础的论文(Guenther等,Nature Genetics。, 2014)证明了目前在识别非编码变异因果函数方面面临的挑战,以及如何通过结合遗传关联研究,大规模克服它们基因组注释项目,如ENCODE,增强子活性的详细功能测试,以及感兴趣的表型的动物模型。
谈话,分组和讨论的目标,机会和建议包括:
定义编码和非编码基因组序列的分子,细胞,器官和器官功能,作为生物学和基因组解释的基础。
NHGRI与其他NIH研究所和中心(IC)一起,应开发和部署能够在变异,基因和途径水平上忠实报告疾病相关功能的分析。应对编码区和非编码区进行优先排序。该信息将提供将功能信息与疾病和健康相关变体整合的基础资源。
功能应该考虑两个尺度:1)分子/生物化学和细胞规模,更接近DNA变体,更容易大规模分析; 2)器官和生物量表,最终是生物学上最相关的水平,但不容易扩展,系统化或表征。我们需要评估不同的分子,生物化学和细胞分析如何捕获生物和临床结果。与生物体或临床结果无关的检测可能导致对假定功能的错误评估,并可能误导科学家利用功能资源。
NHGRI应考虑两种功能优先方法,这些方法最初为所有可能的序列开发功能/元件的目录,然后在疾病研究中将变异与疾病研究中的变体交叉引用,以及变异优先方法,从疾病易感性/关联开始序列然后在功能上表征它们。(注意:Jay Shendure的挑战演讲是一种混合方式,David Haussler是一种变体优先方法。参见App.3)。
应开发计算方法以准确预测非编码和编码序列变异的分子功能,以及反映细胞对扰动反应的模型。
开发并广泛提供可大规模操作基因组序列的工具,并通过实验表征其影响,目的是开发用于忠实模型中序列变异的大规模功能表征的通用方法。
无论样本量在临床数据库和疾病发现队列中有多大,因此无法仅根据统计关联明确确定因果变异。需要支持数据来确定协会的优先顺序,以进行进一步的实验测试,以确定因果关系。NHGRI有机会领导该领域开发测量功能的新方法,并使用所得信息为疾病发现提供信息,从而可以更好地识别临床可操作的变异体。
NHGRI应该就如何扩大最重要的功能测定提出技术挑战(即,对少数区域进行测试并将其扩展到“全基因组”,并对少数个体进行测试并将其扩展到整个群体),同时保持检测有效性。大规模检测应该针对特定疾病或领域的深入和详细的功能研究进行基准测试。NHGRI可以通过与领域专家合作来促进这项工作,他们了解这些“黄金标准”检测和疾病的复杂性和微妙之处。
大规模检测和工具的初步开发可能会集中在分子水平上,但也应考虑如何扩展到器官,生物和临床水平。这将通过开发与相关组织和个体中的生物和临床结果相关的忠实模型和测定来促进。一些检测将提供更多的临时信息,并且在考虑哪些特定检测可以并且不能告诉我们不同水平的功能时需要平衡期望。
该领域目前对蛋白质如何与我们的基因组相互作用有一个简单的观点,应该努力改善我们在这一领域的知识基础。
NHGRI可以帮助促进细胞分析和其他模型,使我们能够测试药物和其他环境因素如何与我们的基因组相互作用。
个人基因组学可以扩展到包括个人功能基因组学,其中变体的功能在临床环境中直接测量。
系统地编目分子组分及其相互作用,跨细胞命运和细胞状态。
除了变体的简单表征之外,功能基因组学是有价值的。高通量测序可用于表征细胞类型(NB ENCODE和Epigenomics Roadmap正在这样做,另一个例子在Aviv Regev关于人类细胞图谱项目的讨论中给出。参见App.4)。该领域的工作适用于多个分类机构和/或共同基金。
监管要素目录不完整。需要在关键组织和细胞类型中进行额外的监管数据分析,重点是与人类疾病最相关的细胞环境。
在通路和系统生物学水平上也应考虑功能。这需要结合多效性和上位性的概念,以及变体和基因的相互作用,而不是仅仅关注单个变异在单一疾病中的影响。
此外,该小组认识到基因组分析对遗传,环境,环境基因和微生物组研究都有信息; 然而,他们认为NHGRI的职权范围可能仅限于考虑遗传效应,并没有进一步考虑其他主题。
临床基因组测序大规模
正如NHGRI战略计划所述, “基因组学发现将在未来几十年内不断推进医学科学,因为在开发改进的诊断,更有效的治疗策略,证明临床疗效的循证方法方面取得了重要进展,并且更好为患者和提供者提供决策工具。“
Dan Roden介绍了“临床护理的基因组测序”
NHGRI与共同基金和其他NIH IC合作,正在进行一系列努力,以促进基因组测序翻译成临床护理。这包括IGNITE,NSIGHT,eMERGE,UDN,ClinGen,临床中心基因组学机会和CSER计划(参见App.2)。
这些努力具有不同的焦点(发现和临床),方法学方法和患者群体。常见问题包括将基因组学整合到临床实践和电子病历(EMR),结果返回,定义目标和偶然发现的可行性,数据共享的最佳实践,以及了解对患者和研究的纵向影响。
精准医学的一个悖论是,需要在大量受试者中产生测序数据,以解释个体患者的症状。
2014年1月举行的第6 次基因组医学会议证明了国际合作的价值。
NHGRI必须在该领域采取协调行动,以最大限度地发挥效益,并将与临床测序相关的风险降至最低。
会谈,分组讨论和讨论的目标,机会和建议包括:
定义基因组测序改善患者结果的临床背景,包括临床有效性和效用,价值和成本效益。
讨论了NHGRI的作用,因为测序在临床实践中变得更加广泛。普遍的共识是,NHGRI拨款不应该用于提供常规护理的临床服务。相反,研究所应支持催化研究,推动遗传和基因组研究结果转化为临床环境,再次提供其他群体建立的模型。需要在这一领域采取行动,以实现改善人类健康的目标。
NHGRI应支持研究,以证明基因组规模测试是否以及在何种情况下改善健康状况。广泛使用的测试应该具有合理的基础,并且需要额外的知识,数据和经验来为资助者和监管者做出的决策提供信息。
需要一种基于证据的范例来证明临床效用,成本效益以及在临床环境中实施基因组测序的总体价值。该领域的工作需要与疾病专家合作。它还需要不同类型的研究和研究设计,包括随机试验,在各种临床环境和不同人群中实施。
NHGRI应该补充诊断性临床测序方面的工作,研究可以解决测序在预防,筛查和其他公共卫生应用中的作用。
改进技术平台,以便在单个测试中快速,可靠地检测所有临床相关变异。
临床测序将受益于准确性的提高,检测到的突变类型的扩展,以及成本和周转时间的减少。私营部门也在推动这一领域的创新。
鉴定和评估RNA /转录组变异可能与某些条件相关。
应该增加正在进行临床测序的组织谱,包括循环无细胞DNA,单细胞和样本,这将有助于提高我们对非癌症体细胞变异的理解。
利用临床测序数据进行研究,从而形成一个学习系统,提高我们对变异和基因疾病关系的理解。
NHGRI需要将自己定位为对NHGRI在公共和私营部门范围之外发生的大量测序产生积极影响,并且越来越多地发生。NHGRI可以通过改进数据共享,开发和编目工具以及建立侧重于临床效用和实施的“范例”研究来做出有针对性的贡献。
NHGRI应该促进临床实践和发现研究中测序之间的“良性循环”。研究推动发现并创造改善诊断和翻译的工具。作为补充,可以利用临床测序和临床数据来推动新发现和知识整合。需要在两个区域之间流动以最大化翻译和发现。
NHGRI应该帮助开发所有接受临床基因组规模测序的患者的多用途纵向队列。理想情况下,该资源将允许基于序列结果对个体进行有针对性的重新表型分析。需要开发分布式平台,使繁忙的实验室和医生尽可能轻松地共享数据。
NHGRI还应考虑其他方法,包括在具有EMR记录的群体中进行测序,以收集良好表达的个体中的靶向和全基因组序列数据。
数据和知识聚合对于变异解释至关重要,将通过改善临床数据的共享来促进,但必须与患者和隐私问题相平衡。
医生,患者和家属应参与临床基因组学和基因组医学的各个方面。这将需要改善公众对基因组学和健康价值的教育。
NHGRI应该探索使用儿童肿瘤学组(COG)作为基因组医学的模型。COG是由NCI赞助的临床试验合作组织,由200多个拥有多学科团队的机构组成,开展了一系列临床研究和转化研究。
在统计学上有效的框架中,使用遗传,功能和计算数据定义稳健的方法来确定基因组变异的致病性。
如果大规模实施临床测序,我们就不能继续依赖手工策划。
NIH应促进临床基因组测序,变异注释,解释和临床传递标准的制定。
确定在常规医疗实践中实施测序的有效和高效方法,并进一步完善NHGRI基因组医学实施研究议程。
NHGRI应该帮助开发用于订购和应用基因组信息的新型临床决策支持工具(NB在Dan Masys的Challenge Talk中给出了一个例子,参见App.4)。在可能的情况下,这些工具应该为医生提供护理点教育。
为了扩大人口影响,显示具有临床效用的测序应纳入更广泛的临床和社会经济环境。
NHGRI应与专业协会联系,在指导方针共识制定的早期阶段提供适当的专业知识,指导和数据。
比较和进化基因组学
正如NHGRI战略计划所述:“最终,必须在进化的背景下理解人类生物学。” 进化过程是理解与人类生物学和疾病相关的变异的基础。
分组主席Andrew Clark和Evan Eichler强调了该领域的重要性和成就:
进化和群体遗传可以为基因型区域的基因型区域相关性的发现和优先排序提供无偏见的框架。
NHGRI一直是比较基因组学的开拓者,促进了更多的科学专业知识,计算方法,社区资源和协作联盟。
灵长类动物和脊椎动物基因组的测序和比对已经确定了大约300万个进化上保守的元素,并且更好地理解了人类和哺乳动物谱系的起源。
人类基因组参考联盟改进了人类参考序列; 然而,复杂和中等大小的结构变异需要进一步的工作,并且以与参考基因组整合的方式在所有尺度上表示人类基因组变异。
分组和讨论的目标,机会和建议包括:
产生高质量的从头测序和基因组装配。
NHGRI应该推进序列技术,以超过当前人类参考组件的质量,以10KK的价格组装新基因组。
NHGRI应该应用先进的和正在开发的测序和绘图技术,以获得~50个人类参考质量或更好的基因组,以充分模拟已知的人类多样性。
NHGRI应继续致力于分阶段的“端粒到端粒”基因组装配,该装配提供对所有遗传变异的综合评估,包括中等大小和复杂的结构变异。了解人类基因组的部分和生产水平映射到当前参考基因组时遗漏的变异类型,并克服这一限制,具有很大的医学和人类生物学意义。
了解人类和灵长类动物的特定基因组变化。
NHGRI应对来自多种灵长类物种的基因组进行测序。这将允许推断人类和其他灵长类的谱系特异性基因组属性的起源,限制和新颖性。
我们的基因组和我们最近的进化邻居的详细进化知识对于解释模型生物学研究非常重要,这些信息可以与变体的功能特征交叉参考(参见上文的基因组功能讨论)。
获得人体中每种保守元素的核苷酸水平分辨率。
除灵长类动物外,NHGRI还应对200只非灵长类哺乳动物进行全面测序。对这些数据的分析将使我们能够了解基因组元素的起源,保守和谱系特异性限制,直至哺乳动物谱系的单碱基对水平。
该信息可用于解释和表征疾病相关变体,并获得对哺乳动物模型生物基因组的更精确的基础理解。
利用模型生物进行功能基因组学研究。
模型生物对于理解变体函数的上下文依赖性仍具有巨大的实用性。模拟生物参考小组的测序将加速功能表征,并提高我们对基因型/表型关联的理解。
模式生物允许在不同环境中检查相同的基因型,并促进基因 - 环境相互作用的研究。国家环境健康科学研究所(NIEHS)和国家科学基金会(NSF)是该领域的潜在合作伙伴。
科学界应该扩大功能研究中使用的模式生物,因为在考虑各种各样的模型时,重要性。灵长类动物提供独特的机会来解决与人类健康相关的科学问题,但也有固有的挑战。
开发组装,展示和比较物种之间和物种内多个基因组所需的信息基础设施。
比较基因组学中的测序工作需要作为整个社区的资源进行组织,并且应该进行协调,以便调查人员相互学习并尽量减少重复工作。
NHGRI应该有助于开发更好的算法和交互式界面,帮助用户从原始数据中组装基因组,使它们彼此对齐,以及理解和操作比较基因组数据。这样的界面包括可以提供物种和界面之间和之内的重排和旁系同源/拷贝数差异的表达的浏览器,其可以从DNA水平的差异转化为RNA,蛋白质和更高功能水平的差异。
第2节:从想法转向实施
一般
NHGRI应继续考虑财政模式,其中赠款具有个人目标,但成员组成工作组,并从计划一开始就确定共同的要素和目标。
NHGRI在保持ELSI嵌入所有这些活动中发挥着关键作用。
虽然采取行动很重要,但我们还需要提醒不要过早达成共识,并应记录和评估不同方案的优缺点。
NHGRI具有强大的项目领导力的历史。开展涉及伙伴关系和与其他实体分担费用的大型项目将需要大量的方案管理和指导。NHGRI应继续重视,支持,招募和留住优秀的项目官员。
发现和临床测序
对于复杂疾病,NHGRI应制定具有灵活性的计划,但同时要有明确的目标和科学界限。程序不能太模糊,需要允许进行有意义评估的结构。在考虑将哪些疾病和研究纳入大规模变异发现项目时,NHGRI需要开发一种灵活且响应迅速的系统,以确保大型测序工作与具有正确类型样品的项目合作,并且正确的科学家参与其中在项目的各个方面。这应该是一个透明的过程,允许访问并包括社区输入。
预计在研究和临床环境中产生的外显子组和基因组数据量将继续显着增加。NHGRI不能指望成为序列生产和产能的主要驱动力。但是,研究所可以在制定标准,改进和实施新的测试方法,传播和整合信息以及作为其他群体的模型方面发挥催化作用。建议NHGRI为多项试点活动提供资金,以探索如何组织能力和资源。
应考虑实施基础资源,使测序对发现和临床应用广泛有用。NHGRI需要提高公众对我们计划的进程,进展和成功的认识。作为一个例子,未来的“建设”项目应该通过能够在更短的时间内拥有卓有成效的产品的项目来补充。需要展示影响并显示客观的进展衡量标准,以维持社区其他人的支持。
CMG和CSER项目展示了多样化测序能力的优势。这些中心促进了专业科学专业知识的发展,以补充更多的大规模努力。
功能基因组学
具有评估变量功能的广泛能力的大型中心可能为时过早,因为尚未知道最具普遍价值的数据类型和规模。对于功能研究,利用具有特定工具,分析和方法专业知识的现有联盟可能具有优势。活动 - 特别是标准,质量控制,资源开发和数据共享 - 可以在不过早或过于规范的情况下进行管理。
NHGRI应该培养新的和新兴的评估功能的方法。这可能最好通过尝试创造性技术开发的R01来实现,并且可能是与国家普通医学科学研究所(NIGMS)合作的好地方。
第3节:其他讨论,交叉主题和建议
本次研讨会提出的广泛挑战和机遇需要特定于疾病和领域的知识和专业知识,而不仅仅是NHGRI社区。此外,NHGRI没有足够的资金或能力来处理所讨论的所有主题。因此,NHGRI必须促进与其他研究所,资助者(即以患者为中心的成果研究所(PCORI))和私营部门在国内和国际上的合作关系。
NHGRI需要将研讨会的标题铭记于心,并扩展到基因组测序之外。这将包括所讨论的功能研究,以及表观基因组学和代谢组学的大规模努力的机会。
NHGRI应努力将“W”重新置于全基因组测序(WGS)中。这包括考虑今天完成的WGS如何与完美(即分阶段端粒到端粒连续)不同,阐明当前技术中缺少的内容,并指定替代技术可以实现的目标。这个话题有时会被忽视,因为它被视为已经解决或过时,但是这个领域可以从更多的投资和创造力中受益。目前通过常规测序对孟德尔病症和其他临床表型进行未确诊的病例应根据结构变异和其他缺失序列数据的潜在作用进行评估。
NHGRI计划都需要在生物信息学,生物计算和数据科学方面取得进展和投资。在设计研究计划和资助机会公告时应考虑该领域的需求。项目需要在生物信息学,生物计算和数据科学方面拥有适当规模和平衡的专业知识,以及足够的资源和支持。
现代共享应用程序编程接口设计方法将实现跨项目的数据互操作性。基因组学可以从其他领域学习,如何在基因组学内实现互操作性,以及基因组学与其他学科之间的互操作性。
NHGRI应充分注意表型,包括研究根据需要同意进行后续表型分析的表型良好的个体。应以可在研究中共享和组合的方式收集表型信息。
NHGRI需要投入更多的培训,包括增加研究人员的多样性; 为博士提供获得临床活动培训的机会; 培训医学生,研究员和临床医生; 增加计算,统计和定量基因组学方面的培训; 并保持足够的培训补助金,以达到推动成功所需的临界质量。
人类疾病是系统的扰动。系统生物学方法应纳入研究。遗传变异的作用需要在细胞,个体和环境的更大背景下被认识到,这可以通过对基因 - 基因和基因 - 环境相互作用和途径的持续研究来实现。