联想生命科学HPC解决方案
生命科学HPC应用分类
基因组医学发展路径
生命科学的主要软件
生物领域中的高性能计算最大的特点就是种类多。
①生物分子的结构测定:lllumina公司的bcl2 fastq,Genome Analys,HiSeq20O0,GAPipeline等;ABI公司的Solid3,Solid4,Bioscope。电镜EMAN,SPIDER:利用Xray方法测量用软件CCP4、ARP/wARP,CNS进行解析等:质谱仪tandom(X!tandom)等。
②生物信息学类计算:最常用的有BLAST,FASTA,HMMER,ClustalW,DNASTAR,PHYLIP,PAML,PAUP,T-Coffee,EMBOSS等。
③分子动力学类计算:主要软件有AMBER,Charmm,NAMD,Gromacs等,这类应用非常适合大规模并行。
④计算机辅助药物设计类计算:应用软件有DOCK,AutoDock,FlexX,Discovery Studio,ZDOCK,RDOCK,MORDOR等.
主要生命科学学科的工作负载
生命科学应用特点及解决方案
1.仪器后处理类的应用:
①计算量和数据量巨大,可靠性要求高;
②大容量存储+并行文件系统。
2.基因序列比对,组装;分子对接,药物筛选:
①计算任务相对独立,进程间通信量很小,计算网线速千兆或非线速万兆即可
②较大内存要求,较高的数据/O吞吐量;
③集群系统:普通两路服务器节点SRXX系列服务器,高密度刀片服务器SD630V2,或SMP胖节点
SR8XX/SR9X,或者水冷服务器SD650V2;
④大容量存储+并行文件系统。
联想井行存储解决方案
使用DSS-G的联想并行存储解决方案,可用于在站点间快速访问、分层和迁移生命科学数据
·测量数据表明,可显著提高性能。进而缩短生命科学分析时间
·可以在联想合作伙伴的帮助下,通过联想HPC团队实施基于BM GPFS的创归档解决方案
联想并行存储解决方案
·以智能群集的形式交付预先集成的GPFS存绪服务器
·高客量和接近线性的甘展能力,面向大型环境
·分摊RA1D重建问,降低网络受到的影响
3.分子动力学:
①集群系统:
高密度刀片服务器集群,4GB/Core,两个本地硬盘:
2线速无阻塞InfiniBand。
生命科学HPC参考架构
联想生命科学解决方案