收藏本页 打印 放大 缩小
0

HPC助力精准医疗

发布时间:2017-07-26 09:30:40    作者:王方琪    来源:中国保险报·中保网

□记者 王方琪

7月20日,在2017联想ThinkSystem & ThinkAgile发布会暨TechWorld’17商用分会上,联想集团高级副总裁、数据中心业务集团中国区总裁童夫尧表示,生命科学行业一直是联想HPC的重点发力行业之一。

HPC与生命科学

HPC是高性能计算机群的简称。指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。现有的超级计算机运算速度大都可以达到每秒一兆(万亿,非百万)次以上

当前,整个生物医学研究进入了大数据时代,这对高性能计算能力提出了更高的要求。6月30日,中国科学院院士陈润生在2017联想全球超算峰会上分享了大数据与精准医疗方面的内容,着重强调了智能计算对精准医疗发展的关键支撑作用。

陈润生认为,要实现精准医学需要有两大基础。一是依赖于组学数据的发展,二是需要把微观上基因相关的变异和宏观上的疾病之间发生关联。

实际上,组学数据的发展主要的困难不是组学数据的获取,而是组学数据的挖掘。如何挖掘出生物医学的含义,其实是计算科学领域所面临的亟需去解决的问题。“只有大规模的组学数据的挖掘,才能获取跟疾病相关的知识。有了这样的知识,才能在微观上掌握和疾病相关的信息。”陈润生说。

把微观上基因相关的变异和宏观上的疾病之间发生关联,这需要建立大规模包括生物信息学、生物网络、系统生物学等在内的很多方法。“这两个基础大大依赖于计算科学的发展,依赖于人工智能的介入,而实现这些基础的方法都离不开整个智能计算所发展的方法、技术、理论和工具。”陈润生说。

据了解,联想HPC在生命科学领域主要聚焦于四类应用,分别是生物分子的结构测定、生物信息学类计算、分子动力学类计算和计算机辅助药物类计算。针对生物领域的高性能计算需求和种类多的特点,联想的生命科学HPC解决方案围绕仪器后处理类应用,基因序列比对、组装,分子对接、药物筛选、分子动力学等内容,采用基于端序列的组装、基于参考的映射等相适应的技术来解决实际问题。

基因组测序的幕后推手

基因测序是精准医疗的基础,而基因组数据分析是生命科学研究中一项极有可能改变未来世界的技术。

即便放在全球,精准医疗也是个极具潜力的风口行业。在精准医疗的风口之下,作为核心的基因测序技术,随着成本下降、能力提升,未来几年内将迎来重要的发展良机。

我国基因测序市场在2010年才逐渐发展,早期由于未得政策支持,相关设备及软件均未获得国家对医疗器械的审评审批,属于“违法医用”。随后几年间,政策不断释放利好,基因测序行业逐步走向规范。同时,在肿瘤诊断及个性化医疗等方面的应用逐步兴起下,基因测序开始进入高速发展时期。

HPC作为一种关键工具在其中扮演了不可或缺的角色。

2016年,戴尔联手SAP推出SAP HANA解决方案, 将基因组测序时间由此前的4天缩短为4个小时,在为病患者夺得宝贵治疗时间的同时,也加速了这项技术走向大众。

据介绍,对于人类健康而言,利用高性能计算和大数据技术的强大数据处理能力,对于人类基因组进行测序和数据分析所带来的价值不可估量。

例如,仅通过对血液或唾液来分析测定一个人的基因全序列,从而对其身体先天饮酒量如何、是否具有运动天赋、未来患上癌症或白血病的几率有多大等给出准确判断。同时,由于能够做到预判,因此也能够为其提前给出个性化、精准的预防和疾病治疗方案。

愿景虽然美好,但这项技术若要发展和造福大众百姓,则面临了计算能力不足的限制瓶颈问题。据悉,一个人的完全测序的基因组包含了100-1000GB的数据量。而一百万人的基因组数据量合计将达1EB(1000000TB)的数据量。要对这么庞大的数据量进行分析比对,则对于运算设备的计算能力提出了极大的挑战。

在研究初期阶段,由于受制于运算能力瓶颈的限制,进行如此数量级的数据处理工作大概需要13年的时间。在后来多年的发展中,随着运算技术及能力的不断提升,人类基因组数据分析所需时间已从“数年”缩短为“数天”。

尽管速度提升惊人,但从应用的角度出发,动辄几天的时间,再加上高昂的成本费用,使得这项技术还停留于少数“贵族”群体享用的阶段,其离普通大众需求还存在相当远的距离。

处理速度的提升在为病患者争取到更多宝贵的治疗时间的同时,也拉近其与普通大众医疗需求的距离,HPC在技术发展上的“一小步”,推动了人类健康发展的“一大步”。