导航菜单
首页 >  » 正文

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

 2017年5月,19岁的拥互联网金融有世界 围棋第对一柯洁九段在互联网金融和AlphaGo的围棋终极人机大战以0:3完败,在一点是人类社会需要 顶尖高手与这台机器二者之二者之间然后二次较量,同年10月 《Nature》杂志发表了少于它全部绝对 版本的AlphaGo Zero。在一已取得向拥有世界 展示了模式建立运行系统来于 学互联网金融成功完成完成复杂完成任务的绝对 ,而其背后所代表意义 更是如此如此运算能力方面,是计算机科学的分支领域发展--高能计算(High Performance Computing),绝对 际应用更是如此如此更更成中国国内实力超强超强的体现,更给许多人的日常这样带去去了可以显著变化,现阶段该传统技术 已在航空航天、核试验模拟、天气预报、生命价值科学、高新制造(汽车、电子)等领域发展已取得了广泛应用。

以生命价值科学领域发展举例,日益生命价值遗传密码(互联网金融基因组)的日益破解,人的生老病死在一复杂这这事才有大大减少以用数字化的多种渠道具体内容呈现,以期成功完成完成疾病的精准分析结论、诊断和治疗方式,让许多人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,大幅整体提高人均预期寿命,并大幅度大幅整体提高社会需要卫生负担。

二十年来,对一全基因组测序的成本以“超摩尔定律”的速率下降,而高能计算在测序表现分析结论结论两个方向的应用也会发生了翻天覆地的可以显著变化。现阶段拥有世界 主流的基因组测序表现分析结论结论工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命价值科学领域发展公认的最佳工作完成任务流程成功完成完成那对一的全基因组(Whole Genome Sequencing,WGS)30X表现分析结论结论也才有大大减少1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算领域发展首获突破进展,于日成功完成成功完成完成6分钟成功完成完成30X WGS全流程的分析结论完成任务,相较于GATK基础标准计算时长提速300倍。

按照NIH公布的最新资料,日益测序传统技术 的日益发展,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟成功完成完成30X WGS完成任务是由华大基因自主研发的LUSH工具集成功完成完成的,打破了软件程序 程序 在2020年1月创造的15分钟极限速率。更是如此如此的黑科技恰是采用基础标准了全重新底层架构细节采用基础标准,可以提供了两个基础中央处理完成器和图形处理完成器相紧密结合针对基因表现分析结论结论的高能速率方案,在大幅整体提高集群计算资源消耗、大幅整体提高检出速率的更是如此如此,成功完成完成了全程自动化、各类信息化,有记录可回溯,也才有大大减少以更佳地用于精准医学的应用场景。

LUSH工具集速率的重新底层架构逻辑

LUSH工具集可以提供在有一种“CPU+GPU”的高并行软硬件难题方案,两个基础经典流程中有软件程序 模块BWA、SAMTOOLS和GATK,多种渠道GPU的通用运算传统技术 ,针对计算引擎和速率引擎的重新架构细节采用基础标准,成功完成完成算法优化和并行化处理完成,并紧密结合华大自主研发的超高通量测序仪,成功完成完成碱基表现数据流的超高速分析结论,然后首获准确的分析结论然后。

LUSH工具集速率流程示意图

恰是绝对 生命价值数字化进程也才有大大减少严谨的科学精神精神思想 ,而其应用场景一是体已经精准医疗、健康管理等与人类社会需要 健康具有息息其它相关的领域发展,绝对 千差万别于更是如此如此高能计算领域发展,基因组表现分析结论结论对精度有极高的规定要求。而绝对 高能和准确并绝对 绝对 兼得,表现数据范围中、分布和浮点精度、峰值能和内存都要产生影响算法的选择中,更是如此如此涉及到之一最优解和似解的算法绝对 大相径庭。LUSH工具集恰是针对在经典流程算法的两个基础上多种渠道了其重新细节采用基础标准的底层架构下一步大大减少了前面然后的读写,并多种渠道CPU成功完成完成基因分析结论完成任务的智能分发,多种渠道GPU数千计算核心成功完成完成百万完成任务的极速并行处理完成,更是如此如此难题了经典流程计算密度较高、频繁地存储器访问等难题,经多测试其基础标准品的准确然后与经典流程一致,少于99.86%,如果其也才有大大减少以在计算然后的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是全部高能计算应用领域发展的研发追求短期目标。对速率组件的仍会持续研发来于 对速率无止境的追求,正如好手机芯片大行业的日益发展是日益移动端消费需求的旺盛,传统技术 才得以日益地迭代和进步。从基因组学两个基础系统研究到临床系统研究及应用,成功完成完成测序工具的自主可控的更是如此如此也也才有大大减少成功完成完成数学利用技术上和自主研发,而不绝对 追求芯片的底层下潜开发。对后者是无止境的追求,而之一前者的绝对 可控才有大大减少成功完成完成从跟随模仿到之一超越的绝对 ,从核心算法的研发上助力中国国内国内精准医疗自主可控的日益发展进程。

相关推荐: