在手机上也能进行全基因组测序分析?没错!5月27日,生命大数据高峰论坛暨第四届基因组云计算技术开发者峰会(GCTA 4)在贵州贵阳新世界酒店隆重举行。华大基因在会上正式发布了该黑科技。
大会是2019数博会的重要组成部分,邀请IT与BT领域的前沿研究者和重磅大咖,以“生命就是大数据”为主题,聚焦“阅读、管理、理解、计算生命大数据”,分享前沿学术报告,解读最新政策及行业动态,为生命大数据的研究与应用再添新动力。
贵阳市副市长魏定梅,贵州科学院院长谭红,贵州科学院副院长李丹宁,贵州科学院顾问、原贵州省工商局副局长陈亦康,贵州省大数据发展管理局产业融合处副处长韩朱旸、北京妇产医院副院长阴赪宏,贵州医科大学教授、贵州省国家健康医疗大数据西部中心专家组组长俞思伟,贵阳国家高新区管委会副主任周平等嘉宾出席了大会。华大基因、华为、GeneDock、微基因、浪潮、东软医疗、阿里云、微软、贵阳大数据交易所等企业纷纷与会。
图1. 魏定梅副市长在致辞中表示,数博会凭借国际化、专业化、市场化的领先优势,成为全球大数据发展的风向标和业界最具国际性和成果性的交流平台,欢迎大家的到来!
图2. 华大集团首席运营官路军在致辞中表示,华大在贵州建立了广泛的合作,连续4年参与数博会。基因即因,未来已来,华大将在前沿研究和关键技术上持续投资,通过提供行业领先的生命数字化技术平台,推动生命科学普惠大众
零的突破,手机可实现个人全基因组测序
WGS(个人全基因组测序)是目前大规模获得人高质量基因序列信息的主要手段。这些海量的数据将被用于评估个人健康和疾病,是助力精准医学的关键一步。
华大基因信息产品高级总监晋向前在大会上透露,华大在搭载麒麟980芯片的Mate 20 pro手机上进行了全基因组测序分析,并成功完成了5X WGS数据的生物信息分析,验证了在简单指令集架构芯片上进行生物信息分析的可行性。
晋向前表示,该WGS数据的完成,是针对移动终端所做的技术选型,目前尚未进行商业开发,但在人类从信息时代走向生命健康时代的今天,具有重大意义。在即将到来的“人人基因组时代”,小型化和便携化的测序仪将成为刚需,移动终端面临处理大量的基因数据,国产芯片的给力表现让研究人员充满信心,并为后续研发指明了方向。
核心工具改变数据解读方式
借助基因测序仪,人类得以“阅读”海量基因数据。过去20年,个人基因组测序的费用以“超摩尔定律”的速度在迅速下降。国产测序仪的加入,更加速了其进程。核心工具的发展推动大规模人群基因组学研究项目不断发展。首都医科大学附属北京妇产医院副院长阴赪宏在主题演讲中指出,为应对我国出生缺陷,2016年国家发布了“生殖健康及重大出生缺陷防控研究”重点专项,计划在2017—2020年四年期间,完成规模达50万出生人口的多中心前瞻性队列研究,最终实现构建致畸风险数据库,建立出生缺陷等级评级系统。项目目前已通过北京妇产医院先试先行,有序推进。
图3. 阴赪宏副院长发表主题演讲
华大股份大数据总监金鑫博士在主题演讲中指出,“管理”与“计算”基因大数据的核心平台在于基因数据中台。而“理解”中国人基因需要中国人自己的基因频率数据库与单倍体参考序列集,目前已构建了CMDB炎黄中国人基因频率数据库。该数据库2018年10月上线以来,已服务科研院所与医院超过180家,API查询调用次数突破4000万次。CIS10K中国人单倍体参考序列集也已完成第一期构建,其Reference Panel数据分析效果优于现有数据集,将在理解中国人基因数据方面发挥巨大作用。
国家基因库大数据应用负责人魏晓锋,也在大会上分享了生命大数据平台的数据服务逻辑。
生命大数据革新场景应用
贵州医科大学附属医院眼科副主任、复旦大学附属眼耳鼻喉科医院干眼中心主任洪佳旭,指出目前眼科医疗资源极度匮乏的现状,基于AI的眼科诊断技术的问世,将极大地缓解该困境。为此,贵州医科大学附属医院、复旦大学附属眼耳鼻喉科医院和华大基因合作研发的Dr.Deep眼科诊断系统,是首个具有自主知识产权的眼科真实世界人工智能诊断系统。研究人员基于40000多例常见眼病图片建立了一套AI算法,在2017年底准确率接近眼科住院医师三年级水平,目前在门诊诊断的测试中,人工智能的诊断率已达90%以上。
图4. 洪佳旭主任发表主题演讲
广州中医药大学中医药数理工程研究院副研究员郑夏生带来《大数据实现中草药物种鉴定的技术飞跃》的主题报告,分享了我国中药鉴定进入标准化智能化时代的关键。此前,由中国中医科学院中药研究所和华大智造联合开发的中草药DNA条形码高通量基因测序一体机在北京完成验收评审,并正式发布。这是全球首创的中草药基因测序智能鉴定仪,将推动我国中药鉴定进入标准化智能化时代,具有重大的科研和产业价值。
图5. 郑夏生副研究员发表主题演讲
天津大学齐浩教授阐述了基于DNA分子介质的信息存储技术的研发进展,并展望DNA生物分子系统与现有信息技术的融合。华为云解决方案架构师严斌展示了华为30年沉淀的数字化技术,分享数据收集、测序分析、数据交付和报告解读等场景的优质解决方案。GeneDock创始人兼CEO李厦戎以《精准医疗的网络化、数据化和智能化》为题,展示在精准医疗领域的探索与实践。Wegene CEO陈钢指出,在个人基因组时代加速到来的当下,数据不仅可以解读,还可以追踪,其应用也将日益广泛。
图6. 圆桌会议
此外,东软医疗、浪潮、阿里云、微软、贵阳大数据交易所等机构也在会上分享最新的服务形态和行业趋势,提速、降本、增效的大数据服务将日趋完善,创新应用场景也将越来越多元。
生命大数据研究院,促进贵州大数据产业发展
会上,贵州医科大学教授、贵州省国家健康医疗大数据西部中心专家组组长俞思伟,与与会者共同探讨了在贵州基因检测的市场和未来发展空间。目前,贵州省响应中央政策,在互联网+医疗方面有自身独特的优势,已建成全国唯一的四级远程医疗服务体系。但在全国范围来看,贵州省总体医疗系统信息化进程还有很大提升空间,后续将发挥本土优势,整合优势资源,应用智能化信息系统优势,对基层医护人员进行赋能,实现医疗服务体系质量的全面提升。
由贵州科学院贵科大数据研究院和贵州华大共同成立的贵州生命大数据研究院,也在会上正式揭牌。未来,该研究院将以生命学大数据为切入点,打造科研创新、人才培养、成果转化、造福民生的创新性机构,同时推进生物资源基础研究、生物产业孵化培育、创新成果产业化,建成一个引领贵州省精准医学发展的基础平台和生命大数据平台。
图7. 贵州科学院院长谭红和华大集团首席运营官路军为贵州生命大数据研究院揭牌
区块链助力共建,基因变异解读标准数据库
大会的另一重头戏是区块链技术助力共建中国人群基因变异解读标准的发布。该标准数据库由中国⻝品药品检定研究院牵头、中国电⼦技术标准化研究院提供区块链技术标准化指导、华⼤区块链BaaS平台提供IT基础设施和解决⽅案,联合厦⻔艾德⽣物、北京泛⽣⼦、北京吉因加等多个基因⾏业领域机构共同发布。
该标准数据库旨在通过区块链、密码学等技术,搭建公开、可溯源、不可篡改、符合伦理要求和审计监管的解读标准。在精准医疗时代来临之际,通过全新的⼤数据合作范式,多⽅共有、共享、共为,形成临床检测和临床解读的标准示范。
图8. 区块链技术助力共建中国人群基因变异解读标准数据库发布
生命科学黑科技组团发布
黑科技年年有,今年特别多!在华大科技研发总监唐冲博士带来的主题报告中,华大自主开发的多组学数据挖掘系统Dr.Tom吸引了极大关注。该系统是集大数据分析及人工智能技术于一体的一站式个性化分析系统,开创性地创建了任意调动、自由循环的智能数据挖掘体系,大大降低了个性化分析难度和成本,助力零生信基础的科研人员完成高质量数据挖掘,并可将信息分析效率提高30倍以上。
图9. 唐冲博士发表主题演讲
华大科技服务研发高级工程师林哲向与会者推介了stLFR技术。该技术基于华大智造专利的DNA分子共标签技术,即将来源于同一DNA长片段的短读测序片段标记上相同分子标签,实现了基于高精度短读测序获取长片段DNA信息。该技术与华大智造世界领先的DNBseq测序技术相结合,实现高质量变异检测、二倍体基因组定相、结构变异解析及其他长读长应用。
华大智造生信算法研发方向负责人谢寅龙在报告中指出,深度学习技术已在众多领域展示了强大的潜力,而基因测序分析领域也产生了一些应用深度学习技术的工具方法,其精度显著超过普遍使用的传统分析方法。华大智造针对自身测序平台MGISEQ,实践并优化了深度神经网络模型,使得精度再进一步,同时结合硬件加速技术形成整体分析方案MegaBOLT,为基因数据分析提供了一种较好的实践方式。
图10. 大会现场