Jinghui Zhang是St. Jude Cloud背后的推动力量,这是一个为研究人员提供儿科癌症基因组和数据分析工具的平台。本周在佐治亚州亚特兰大召开的美国癌症研究协会2019年会议上,来自圣犹达儿童研究医院的张和她的同事正在庆祝上传到该平台的10,000个基因组。他们还在推广名为GenomePaint的新基因组浏览器,旨在整合患者的基因组学,转录组学和表观基因组数据。
科学家与张先生谈到了她对St. Jude Cloud的看法,以及该平台随着时间的推移如何变成具有从儿科癌症患者和幸存者收集的最大数量的全基因组的数据库。
科学家:圣犹达云背后的灵感是什么?
Jinghui Zhang:我实际上必须从公共存储库下载数据,我们认识到下载公共数据集的工作量和挑战。如果我们可以在云上上传数据,然后科学家可以将他们的工具带到云上,那么我们就不再需要进行数据下载了。
我也是一名工具开发人员,因此我必须与全球研究社区分享我的工具。我们可以在云上上传我们的工具,您只需进行一次安装,每个人都可以直接使用它。
第三个组件是数据可视化。如果我们将数据放在人们可以想象的形式中,那么没有计算技能的研究人员就可以开始分析数据了。
TS:多年来St. Jude Cloud是如何演变的?
JZ:我们在2016年开始了我们的原型。最初,我们只关注那里的工具。从2017年开始是主要演变的来源。这是微软决定与我们合作的地方,因此我们能够获得用于托管这些数据集的云存储空间。
第一个里程碑出现在2018年,[当时]能够将5000个全基因组放在云上。今年的AACR将成为10,000个全基因组的第二个里程碑。
TS:谁使用St. Jude Cloud?
JZ:有三个独立的研究实体。最明显的是参与全球儿科癌症研究的研究机构。第二组[那些]一般参与基因组研究,因为我们的资源是一个非常基因组的数据集。第三组对我们的工具更感兴趣。有些团体甚至没有参与癌症研究,但一般的人类疾病研究[那]有兴趣利用我们的工具来治疗他们的特定疾病。
TS:St. Jude Cloud对儿科癌症研究的影响是什么?
JZ:我们在全球400个研究所共有800名注册用户访问过这些数据。我已经从澳大利亚的一个小组了解到,他们提到他们每天都在使用我们的可视化工具进行临床工作。
对于我们在St. Jude的临床基因组学计划,我们开发了这种快速的RNA-seq工具,我们用它来进行融合基因检测。[编者注:融合基因是可导致癌症的基因杂种。并且该工具用于实际确定癌症患者是否将被放入临床试验的一个分支中,并且需要非常快的周转时间。通过云计算,它确实将数据分析从最初的一周减少到几个小时。这使我们能够满足做出临床试验决定的时间表。
TS:平台的下一步是什么?
JZ:有几件事。一个是扩大[更多]患者,更多样本,扩展数据资源。第二件事是结合我们从儿科癌细胞系产生的额外的表观遗传数据,以便我们可以促进非编码方差的解释。第三个方面是。。。我们正在与国家癌症研究所讨论建立联邦数据系统,因此我们的数据库可以与NCI [就像他们的数据门户]建立的资源进行通信,这样我们就不会在孤岛中建立数据库。