大数据存储解决方案提供商

媒体报道 当前位置 >> 新闻中心 >> 媒体报道

计算机报:关于自主创新的几个问题

发布日期:2010-08-12

1.      中科院国家高性能计算机工程技术研究中心这么多年来一直在搞自主研发。您感觉,与国外技术相比,我们的水平如何?

    许鲁研究员:工程中心的自主研发并不是闭门造车。自主研发的基础是现有成熟的相关技术;自主研发的方向是解决用户需求,特别是具有中国特色的用户需求中的核心问题。

    在自主研发的过程中,工程中心也在经常与国内、外同行进行技术交流,不断地校准研发方向,提高研发水平;同时,也经常与用户进行需求交流,核实工程中心的研发目标。

    通过数年来的工作努力,工程中心的自主研发水平在一些方面与国外技术相比已达到了同等技术水平;而在某些方面,甚至于超过了国外技术水平。这些情况在与相关技术同行们的交流中也得到了认可。

    当然,工程中心在许多方面与国外技术还存在着差距,并非能够一蹴而就,需要长期积累。在全国大力提倡自主创新的今天,工程中心的自主研发会乘势而起,更上一层楼。


2.      您认为,中国人搞自主创新,应该从哪些方向入手才可能有大的进展?

    许鲁研究员:我个人以为,自主创新不能一哄而上,搞一刀切。政府大力提倡自主创新,是反映一种大的趋势和需求,但并非所有的事情都完全一样。

    古人做事讲究“天时、地利、人和”,自主创新也不例外。

    对于自主创新,天时是指应用需求,特别是具有中国特色的用户需求。对于国家级研究单位,国家的战略性需求更为重要。

    地利是指技术创新时机。技术发展是有其客观规律和时间性。我们必须尊重客观规律。

    人和是指具备相关的社会环境,包括具有创新精神的团队、丰富的人才资源和社会创新配套机制,包括国家对于自主创新的支持政策等多个方面。

    我个人以为具备了以上条件的领域,才最有可能有较大的进展。

    以存储技术研发为例:数据的爆炸式增长和相关应用技术的发展,直接拉动了存储技术的研发。就国内需求而言,在“工业化带动信息化,信息化促进工业化”的国家战略的引导下,国内存储需求发展迅速。但由于应用领域人才和经济承受能力等方面条件的制约,国外现有技术往往不能满足相应的需求。特别是对于一些国家战略性行业,其发展受制于国外技术厂商,难以持续、健康的发展。这些需求构成了存储技术自主创新的“天时”。

    存储技术发展目前正在经历着重大变革。作为两项“破坏性”技术(Disruptive Technologies),iSCSI(IP存储)和SATA/SAS技术的发展和成熟,为存储系统技术和应用技术的发展提供了重要契机,大大缩短了国内与国外的技术差距。以此为基础,我们可以有效地研发具有中国特色的存储技术。这些技术机遇构成了存储技术自主创新的“地利”。

    国内在操作系统和服务器等领域进行了长期的研究和开发,这为存储技术等系统相关研究领域提供了大量的人才积累。国内存储领域的研发单位通过近年来的工作努力,不仅积累了相关的专业知识、相关系统,而且培养了大量的技术人才和管理经验。随着信息行业的发展,相关政府政策和社会机制日益完善,特别是国家对于自主创新的重视,为存储技术的发展提供了良好的社会环境。这些构成了存储技术自主研发的“人和”。


3.      您认为,现阶段,搞自主创新,遇到的最大困难是什么?

    许鲁研究员:我以为自主创新的最大困难是成果应用。成果应用包含成果应用定位和成果实际应用。

    自主创新一定要先有成果应用定位。应用目标是自主创新的起点,但成果应用定位需要深入了解应用的需求和特点,才能做到准确和正确,这不仅仅需要科研机构的努力,也需要企业厂商,甚至用户的合作。

    自主创新不是一个点,而是一个持续的过程。自主创新成果需要在实际应用中校准和验证,才能进一步提高。因此,实际应用是自主创新持续的保障。但在许多应用领域中,厂商和用户对于自主创新技术还有很大的抵触心理。将成果投入真正的实际应用,需要提高自主创新技术的实用性和改善相应的心理环境,这需要机制和政策等多方面的配合。


4.      据您了解,像您和您的同事这种专门搞存储研发的人,在国内多吗?中国的存储人才状况如何?

    许鲁研究员:存储技术的发展在国内还处于早期。专门从事存储研发的人才还相对较少,专业人才情况也不容乐观。但存储领域与操作系统、服务器等系统领域的相关性很大,而我国在后两个技术领域已经有了多年的工作,并获得了长足的发展,在人才方面也有较多的积累。这对于存储技术的研发有着直接的支持作用。


5.      从中科院国家高性能计算机工程技术研究中心的角度,你们如何促进科研成果向商品化转化?能举例说明吗?

    许鲁研究员:为了有效地促进研究开发的效率和科研成果的转化,工程中心将整个研发过程分为多个项目完成。根据特点,项目可以分为研究项目、工程预研、工程项目等多个种类。针对不同类型的项目,工程中心制定了不同的管理办法。对于每个项目,特别是工程性较强的项目,工程中心采取严格的目标和过程管理。通过多年实践,工程中心已经探索出了一套有效研发流程,我们称之为“递进式滚动研发模式”。通过研究、开发、产品和市场等专业人员的适时介入,可以有效地保证从研究、工程、产品和推广的整套流程。为了保证人员的持续参与和工作的可追溯性,工程中心建立了各种服务平台,并将其统一到一个工作平台下,有效地提高人员的工作效率以及项目信息的可获得性。

    如在蓝鲸虚拟存储系统的研发过程中,我们将整个研发过程划分为研究项目、工程预研、工程项目等多个项目。针对每个项目,我们采用了递进式滚动研发模式进行项目的目标和过程管理。所设计的服务平台包括版本管理、需求管理、项目和任务管理、记录管理、测试用例管理、自动测试等多个平台,大大提高了项目的研发效率和工作的准确性。


6.      很多厂商反映,高校和科研机构的研发和商品化是两条平行线,没有很好结合。你对此如何看法?你认为原因何在?

    许鲁研究员:我个人以为这基本上是一种事实陈述。这种现象的发生未必是偶然的,有其必然性。其中可能有许多原因,但我认为下面是最主要的原因之一。

    有数据表明,自1998年以来,我国科技对经济增长的贡献率有所下降。这不是说科技工作者不努力,它是讲我们过去的经济增长模式,主要是靠投资拉动的,资本的贡献在40%以上,产业技术基本上靠引进,本土的科技能力没有为国家发展提供有效支撑。基于这样一个结果,我们可以看到,产业技术对于本土研发成果没有很强的需求。

    随着社会的发展,这个情况在发生巨大的变化。国家提出自主创新,我个人以为,与其说是一种工作号召,毋宁说是一种趋势判断。这个判断的基础是国家、经济和企业的未来发展越来越依赖于自主创新的能力,而不能再依赖于外来技术和简单投资。

    在这个变化过程中,不仅高校和科研机构要调整自己的工作模式、促进研发成果和商品化有效地结合,企业厂商也要调整已有的工作模式,社会政府同样要调整现有的管理和评价体制。否则,企业厂商将会失去竞争力,科研机构将失去生存空间,社会将不能高速发展。


7.      国家召开科技术大会,提出“自主创新”,您如何看待自主创新?这对未来的存储发展将起到什么样的作用?

    许鲁研究员:上面我们已经谈到了许多次自主创新。我以为,自主创新确实反映了我国发展的趋势。这是我们科研工作者非常好的机遇。但是,自主创新远远超出了科研工作的范畴。除了科研单位的意识调整之外,企业和社会的意识调整也势在必行。

    存储领域的战略意义和经济价值不言而喻,其社会需求明确;相关技术的发展为存储技术的进一步创新提供了基础。因此,对于存储领域的自传创新来说,已经具备天时和地利,可谓万事俱备只欠东风。国家提倡的“自主创新”对于存储技术的发展就是一股强劲的东风。中国存储领域必将乘势而起,取得巨大的发展。

注:以上观点,仅为许鲁研究员个人观点。

 

基于SAN的集群文件系统及其应用

    在高性能计算领域,集群计算机已经成为主流结构(在TOP500中,占据72%)。随着集群的规模不断扩大,I/O已经越来越成为限制集群应用继续扩展的主要瓶颈。

    集群应用分为计算密集型和数据密集型两大类。所谓数据密集型应用,主要指在计算过程中使用、生产大量数据的应用,这种应用模式对集群系统在数据的峰值高速导入、大量并发共享访问、高速传输、高的I/O扩展性、大目录(大量小文件)和大文件的性能等多个方面都提出了很高的要求。随着互联网的发展,全球信息量呈几何级数爆炸性增长,而数据密集型应用也随之大量增长,如石油物探、高能物理、遥感信息处理、气象预报等,有些应用每天生产的数据有几个TB。除上述传统数据处理领域之外,集群在商业计算领域也逐渐开始应用,如银行的省级及全国结算中心、电信部门的数据中心、电影动画制作等。

    I/O密集型是数据密集型应用中最主要的一种,如果集群的结点无法获得高速率的数据传输,其计算性能也无法充分发挥。传统的存储一般采用网络文件系统(Network File System,NFS)进行数据传输和共享,由于其固有的结构已经成为集群处理的瓶颈,导致集群节点的CPU使用率非常低,严重影响了计算能力的发挥,甚至出现节点越多运算速度越慢的情况,有的应用环境,CPU利用率只有10%左右,这就导致了“高性能不等于高效能”。

    基于SAN的集群文件系统是解决集群I/O密集型应用的主要技术之一。基于SAN的集群文件系统是采用元数据集群和SAN并行处理I/O请求的分布式文件系统,对集群应用来讲,提供统一的访问入口和全局的文件系统,元数据集群和SAN对应用是透明的,当客户端增加,I/O能力不足时,可以动态增加SAN中的存储设备,提高I/O吞吐率;当元数据处理能力不足时,可以动态增加元数据服务器,提高元数据处理能力。对于I/O密集型应用,基于SAN的集群文件系统无疑很好的解决了I/O吞吐率和I/O扩展性的问题。

    从定义可以看出,基于SAN的集群文件系统包括两个主要逻辑组成部分,元数据服务器集群和SAN,前者负责处理元数据请求,后者负责处理I/O读写,而且,二者的处理是相互独立、并行进行的,即客户端直接到SAN上进行数据读写,因此,系统的I/O带宽是并发的和高可扩展的。基于SAN的集群文件系统采用集群的设计思想,采用全分布式处理结构,元数据和数据处理全部采用集群(SAN是一个设备集群)结构,且二者处理完全分离,因此能够很好的满足集群应用的处理模式。其主要特点包括:

支持大规模集群,目前可支持上千个节点的集群;

支持大容量存储,目前已有部署上百TB的集群文件系统;

高的I/O聚合吞吐率,达到数十GB/s;

高的动态可扩展性,系统性能、容量的扩展全部是动态的,且对客户端透明的;

支持目前集群主流的网络,GE、Myrinet和IB,其中GE是最主要的形式。由于FC网络设备价格较高,在集群中采用较少,因此集群文件系统对FC的支持很少。

高可靠性,采用元数据控制器FAIL OVER技术、文件系统日志技术保证服务和数据的可靠性。

    此外,应用于集群计算的还有并行文件系统,如PVFS、RedHat的GFS、IBM的GPFS、Veritas的CFS, Polyserve的Matrix等。并行文件系统采用对称结构,即元数据服务运行在集群的节点上,由于每个元数据服务要服务于集群的所有节点,因此,当集群规模增加时,其扩展性受到限制。相比采用独立的元数据集群的模式,并行文件系统的性能扩展性低于集群文件系统。

    目前主流的集群文件系统有CFS的Lustre、Panasas的PanFS和国家高性能计算机工程技术研究中心的BWFS等。Lustre和Panasas均起源与CMU的NASD项目,采用基于对象存储设备(OBD)技术。BWFS起源于国家863项目,是目前国内唯一的集群文件系统产品。

    Lustre是面向I/O密集型集群应用、支持上万个集群节点、数百TB存储容量的对象集群文件系统。Lustre包括Client、MDS和OST三个部分,OST负责数据存储和访问,其支持对象访问协议,MDS负责元数据访问和锁管理。Lustre采用Portal支持异构网络环境,底层采用EXT3格式存储数据,对应用支持Posix语义的接口,节点通过Client透明的访问数据。Lustre目前支持2个MDS的FAIL OVER方式,尚未支持MDS集群。Lustre的开发采用开发源码的方式,目前对外发布的是1.4.6版,已经应用在Los Alamos、Lawrence Livermore、Sandia National Laboratories。

    PanFS主要面向大规模的Linux集群,其产品很有特点,在一个设备中集成了存储节点StorageBlade(9~10片)和元数据服务器DirectorBlade(1~2片),通过4个GE输出,多个设备可以堆叠。其中DirectorBlade负责处理元数据请求,2个DirectorBlade以集群方式运行,从而提供高的数据带宽。在集群节点安装DirectFlow软件,为集群应用提供全局的文件访问接口,底层与Lustre一样,采用EXT3格式存储数据。PanFS目前已经应用在生物信息处理、石油地质勘探、流媒体、CAE等领域。

    BWFS基于IP技术,支持大规模异构集群,支持Linux和Windows平台。BWFS包括MS集群、SN集群、IFS和AD,MS集群负责处理元数据请求和负载平衡;SN集群负责数据存储和数据服务;IFS安装在集群节点并对应用提供统一的全局文件系统访问接口;AD为用户提供BWFS的管理服务。BWFS采用带外数据模型、LazyBinding、分层资源管理、针对应用的动态一致性语义等技术,集群节点直接到SN集群并发访问数据,且MS集群和SN集群均可以在线动态扩展,具有非常高的I/O聚合带宽和极强的I/O可扩展性,在某些应用领域,性能比原有系统提高了数十倍。目前,最新发布版本为BWFS v4.0,并已经应用到石油地质勘探、遥感数据处理、高性能计算、大型信息中心、信息检索与处理等多个领域。

    目前,随着集群应用的不断拓展和规模的不断增长,I/O问题将越来越凸现,其对集群文件系统的需求将越来越迫切,而集群文件系统的技术目前已经趋向成熟,万兆以太网的成熟也将推动集群文件系统的应用。