华大基因借Tesla解决DNA海量数据问题
泡泡网显卡频道12月15日 华大基因是全球最大的基因组研究机构,英伟达(NVIDIA)公司今天宣布,该研究机构利用基于英伟达Tesla GPU的服务器群大幅缩短了工作时间,使分析大批DNA序列数据的时间从将近四天缩短至短短六个小时。
研究人员需要以负担得起的价格确定携带遗传信息DNA的碱基对序列,这一速度提升在这方面迈出了关键性的一步。对基因组学行业实现1000美元基因组的目标来说,这一点至关重要。如果实现这一目标,基因组学即可用于临床诊断试验,成为病患治疗的日常手段。
华大基因高性能计算应用主管王丙强表示:“我们正淹没在高通量测序仪每天所产生的基因数据当中。由于基因组分析应用程序实现了GPU加速,因此我们的科学家能够以比较独特的速度完成对这些数据的处理,深入了解细菌、植物以及人类的基因奥秘。它让专业的研究人员以及医疗工作者能够找出行之有效且负担得起的个性化药物以及治疗方法。”
华大基因的研究人员与合作人员已经开发出三款基因组数据分析应用程序,这些应用程序均可由英伟达 Tesla GPU 来加速:
- SOAP3比对应用程序 —— 将测序仪产生的短DNA序列与现有的参考基因组序列进行比较。通过GPU加速,SOAP3比对程序在数十秒内即可在每一百万次解码中找出三个不匹配的比对,而未实现GPU加速时,该过程需要耗时数分钟之久。为了对比之前已定序和研究过的基因组,研究人员需要对单个基因组进行测序和拼装。这种加速意味着,可以快速执行单个基因组的测序分析,以了解潜在的未来疾病状态和治疗方法。
- GSNP(SNP检测) —— 它是SOAPsnp软件的GPU加速版本,该软件应用广泛,可检测基因组DNA中单个核甘酸多态性(SNP)的变种。这些变种可用来研究人们生病的差异以及对细菌、病毒和药物的反应。
- GAMA(高分辨率基因型分析工具) —— 找出特定基因变种的发生分布或频率,例如一组基因中的眼睛颜色或前列腺癌倾向。
英伟达Tesla事业部经理Sumit Gupta表示:“科学界想要实现1000美元基因组这一里程碑,唯一的方法是利用合适的技术,这些技术能够令DNA数据分析变得更轻松、更快速、价格更低。GPU计算让研究人员能够在自己的科学应用中实现改变行业面貌的速度提升,有助于为各类关键研究项目降低成本和复杂度。”
从植物与大肠杆菌到大熊猫,华大基因对各种生命形式的基因组进行测序和全面的基因组科学研究,这些开创性工作的目的是开发更好的药物、改善医疗以及改良农作物。华大基因的测序能力预计很快即可超过每年700000个人类基因的当量。与最初耗费13年时间才完成一个基因组的定序相比,这无疑是一次大幅的提升。
英伟达Tesla GPU是基于英伟达(NVIDIA) CUDA并行计算架构的大规模并行加速器。通过使用CUDA C、CUDA C++和CUDA Fortran等语言或使用基于指令、简单易用的编译器,应用程序开发人员即可加速其应用程序。
如需了解华大基因的更多信息,敬请访问华大基因网站。如需了解英伟达Tesla GPU的更多信息,敬请访问英伟达Tesla网站。如需了解英伟达CUDA的更多信息,敬请访问英伟达CUDA网站。
想要查看更多英伟达新闻、公司和产品信息、视频/图像以及其它信息,敬请访问英伟达新闻中心。■