大数据存储解决方案提供商

高性能计算存储 当前位置 >> 解决方案 >> 高性能计算存储

高性能集群存储解决方案

发布日期:2011-03-21

应用背景
    从上个世纪80年初计算机应用开始,高性能计算机系统已经经历了好几代的更新,从早期的向量服务器,到UNIX服务器,一直到现在集群(PC Cluster)。目前的趋势是PC Cluster来代替原有的UNIX服务器。
    高性能计算往往是一种数据密集型和计算密集型相结合的应用,对计算和I/O的处理能力都有较高的要求。而在使用PC Cluster进行数据处理的时候,一个最主要的问题就是数据的I/O瓶颈问题。如果PC Cluster中的节点无法获得高速率的数据传输性能,其计算性能也无法获得充分发挥。例如,在石油地质勘探处理中的测试情况为,常规处理单个节点带宽可达到100MB/s,48个节点迭前处理带宽也超过100MB/s。随着国内外应用软件的快速发展,对于存储容量和I/O带宽提出了更高的要求,存储环境已经成为未来高性能计算集群大规模发展的关键因素。
    目前,在我国大多数的高性能计算集群中,PC Cluster环境通常采用网络文件系统(Network File System,NFS)进行数据传输和共享,但由于受到NFS协议的限制,其数据传输性能较差,能够进行并发计算的节点数量非常有限,严重制约计算能力的发挥,从而导致数据处理应用程序不能获得很好的性能。特别是针对多个任务处理的情况,其性能会急剧下降,导致PC Cluster节点的CPU使用率只有10%~50%,严重影响了计算能力的发挥。
    针对PC Cluster环境中存在的I/O瓶颈问题,已经有不少国外研究机构和厂家研制了集群文件系统,典型的有Lustre、Panasas、GPFS等。但目前国内除中科蓝鲸公司外,还没一家国内的厂商研制集群文件系统。中科蓝鲸的BWStor CSA是目前国内唯一一款内嵌了集群文件系统(BWFS)的国产存储产品。

 

解决方案
    为解决目前高性能计算集群的存储系统瓶颈问题,中科蓝鲸公司提供了基于BWStor CSA 5000的解决方案。方案系统结构图如下所示:

 

    方案由BWStor CSA 5000(含IO节点)和SAN环境组成,能够将用户已有的光纤盘阵或新购光纤盘阵转换成基于IP的并行文件系统,从而支持大规模高性能计算集群应用。
    一般高性能集群计算按照项目/应用程序进行管理,而单个项目的存储容量一般在几个TB,每个项目放在一套存储系统上进行处理和管理。因此,基于BWStor CSA的解决方案,将BWStor CSA加SAN环境作为高性能计算集群中所有应用的集中存储系统,再将该系统提供的统一存储池划分为多个独立的存储空间—文件目录使用,每个项目的数据占有一块独立的空间,所有PC Cluster的节点全部连接到核心交换机上,通过千兆以太网高速共享访问相应的存储空间。


本方案能在以下几个方面很好的解决高性能计算集群中的存储问题:
    1、数据统一存储与管理:BWStor CSA系统可提供统一的存储空间,再划分给不同的项目进行使用,存储空间的扩展对用户和各项目是透明的,避免数据在多个存储系统中的导入、导出,便于对数据进行统一备份和管理,同时提高了存储空间利用率和数据处理效率。
    2、高带宽和性能可扩展性: BWStor CSA系统在体系结构上采用了先进的带外数据传输方式,数据直接访问光纤盘阵,从而最大程度发挥SAN的性能。在多个客户端顺序访问、单个IO节点的配置下,I/O带宽可达200-400MB/s,当IO节点和存储设备数量增加时,BWStor CSA聚合带宽随设备数量几乎呈线性增长。而且,当前端客户端数量增加时,BWStor CSA能够保持高的访问带宽,相比NAS系统,具有非常好的负载平稳性。在高性能计算集群应用中,该特性使得BWStor CSA系统在前端PC Cluster的规模按需调整时,也能保持稳定的I/O性能,这个特性在多个项目并发时,能够保证多个项目都能够得到稳定的I/O带宽。
    3、存储容量的动态可扩展性:BWStor CSA系统可以在业务不停止的情况下扩展系统容量,实现存储容量的按需动态扩展,适应高性能计算数据逐年增长的需要。
由此可见,BWStor CSA系统能充分利用多个存储节点进行并发数据传输,从而获得很高的数据传输性能,能够向集群中的众多节点提供高性能的数据传输服务和数据共享服务,充分发挥PC Cluster的计算能力和软件的性能。同时,使用BWStor CSA系统完全兼容NFS语义,在NFS上运行的应用程序,不必进行任何修改,就可在BWStor CSA上运行。
    高性能计算集群应用中使用了BWStor CSA系统后,为前端PC Cluster提供了高速率的数据传输性能,PC Cluster节点的CPU使用率可以提高到90%以上,大大提高了PC Cluster的利用率。在本方案的实际使用案例中,以前需要计算3个月完成的项目,现在只需要1个月即可完成。

 

应用领域
    航空航天企业的设计和模拟
    遥感信息处理
    石油、煤炭等勘探数据分析
    生物分子研究与基因工程计算
    气象数据分析
    金融业汇率计算
    VOD服务集群
    医疗影像处理
    Web/Email服务
    保险业务数据存储