首页 科技资讯大全正文

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

 2017年5月,19岁的当前我国围科技视界棋第有个人之间 柯洁九段在和AlphaGo的围棋终极人机大战以0:科技视界3完败,尤为 是人类进化顶尖高手与这台机器关系 尤为这十次较量,同年10月 《Nature》杂志发表了累计它一切的这版本的AlphaGo Zero。过一显著成绩向当前我国展示了有待建立系统提供图片频道学快速完成复杂其他任务尤为这,而其背后所代表者除此以外 运算核心技术能力,是计算机科学的分支其它领域--高能计算(High Performance Computing),仅仅 不然际应用尤为又又成当前我国综合超强实力的体现,更给大家的日常的这带来什么来什么了方式大变化,目前已该核心技术已在航空航天、核试验模拟、天气预报、个人生命科学、高新制造(汽车、电子)等其它领域显著显著成绩了广泛应用。

以个人生命科学其它领域举例,逐渐个人生命遗传密码(基因组)的逐渐破解,人的生老病死过一复杂一一件事 除此以外 用数字化的多种渠道明确的 呈现,以期快速完成疾病的精准分析得科技视界出、诊断和其他相关治疗,让大家远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,全面整体提高 人均预期寿命,并大幅度全面整体提高 社会整体卫生负担。

二十年来,有个人之间 全基因组测序的成本以“超摩尔定律”的速率下降,而高能计算在测序最终分析得出得出前进方向的应用也已发生了翻天覆地的方式大变化。目前已当前我国主流的基因组测序最终分析得出得出工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项个人生命科学其它领域公认的最佳我的工作流程快速完成那的这 人的全基因组(Whole Genome Sequencing,WGS)30X最终分析得出得出除此以外 1800分钟。深耕于基因组学20多年的华大基因在基因组高能计算其它领域再获突破进展,于日成功了快速完成6分钟快速完成30X WGS全流程的分析得出其他任务,相较于GATK具体标准计算时长提速300倍。

实际情况NIH公布的最新科技视界资料,逐渐测序核心技术的发展进步,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟快速完成30X WGS其他任务是由华大基因自主研发的LUSH工具集快速完成的,打破了软件程序 程序 在2020年1月创造的15分钟极限速率。中则 的黑科技也是采用机械了全全新底层架构风格采用机械,直接提供了做基础中央处理方法器和图形处理方法器结合起来起来采用机械基因最终分析得出得出的高能速率方案,在全面整体提高 集群计算资源消耗、全面整体提高 检出速率的尤为,快速完成了全程自动化、各种信息化,有记录可回溯,除此以外 会会更好用于精准医学的应用场景。

LUSH工具集速率的全新底层架构逻辑

LUSH工具集直接提供过那种“CPU+GPU”的高并行软硬件完美解决出现方案,做基础经典流程中则 软件程序 模块BWA、SAMTOOLS和GATK,多种渠道GPU的通用运算核心技术,采用机械计算引擎和速率引擎的全新架构风格采用机械,快速完成算法优化和并行化处理方法,并结合起来华大自主研发的超高通量测序仪,快速完成碱基最终数据流的超高速分析得出,的这再获准确的分析得出的这。

LUSH工具集速率流程示意图

也是仅仅 不然个人生命数字化进程除此以外 严谨的科学其精神,而其应用场景大多体那的这 精准医疗、健康管理等与人类进化健康拥有息息其他相关的其它领域,的这各不各不相同于除此除此以外 高能计算其它领域,基因组最终分析得出得出对精度有极高的提出要求要求。而仅仅 不然高能和准确并非能够基本兼得,最终数据覆盖范围、分布和浮点精度、峰值能和内存总会很大影响算法的选择利用它 ,尤为涉及到仅有 最优解和似解的算法的这大相径庭。LUSH工具集也是采用机械在经典流程算法的做基础上多种渠道了其全新风格采用机械的底层架构有待大幅减少了中关系 这的读写,并多种渠道CPU快速完成基因分析得出其他任务的智能分发,多种渠道GPU数千计算核心快速完成百万其他任务的极速并行处理方法,尤为完美解决出现了经典流程计算密度较高、频繁地存储器访问等完美解决出现,经近测试其具体标准品的准确的这与经典流程一致,累计99.86%,的这其除此以外 在计算的这的准确与极速上得以衡。

更优越的能、更低的成本和更高效的检出是一切高能计算应用其它领域的研发追求一个目标。对速率组件的持续的研发图片频道对速率无止境的追求,正如手机中芯片行业发展的发展进步是逐渐移动端市场需求的旺盛,核心技术才得以逐渐地迭代和进步。从基因组学做基础持续的研究到临床持续的研究及应用,快速完成测序工具的自主可控的尤为也除此以外 快速完成数学利用它上是自主研发,而尤为仅 不然追求芯片的底层下潜开发。对后者是无止境的追求,而不能够前者的基本可控不能够快速完成从跟随模仿到不能够超越尤为这,从核心算法的研发上助力当前我国精准医疗自主可控的发展进步进程。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。