PBS Professional 助力捷克国家超级计算中心的作业负载管理

2014-5-5 14:24| 发布者: xiongwu| 查看: 1432| 评论: 0|来自: Altair

摘要: PBS Professional 实施起来迅速简单,使用户可以快速投入工作,具备了我们对调度程序所要求的强大商用功能。此外, Altair 提供的高水准支持正是我们这样的机构极度需要的。

项目介绍
国家超级计算中心IT4Innovations是捷克共和国VŠB—— 奥斯特拉瓦技术大学(VŠB-TUO) 中的一个研究机构,由欧盟运作项目“创新研究与开发”资助。来自捷克共和国 各大主要科研机构的数以百计的研究人员在利用该中心进行计算工作。自2011年起,IT4Innovations便加入了享负盛名的欧洲PRACE超级计算中心网络,为来自欧洲其他国家 的研究人员提供计算资源。

挑战
IT4I 国家超级计算中心正在建造一台独一无二的超级计算机,用以支持该中心的用户所 进行的前沿计算研究。这台超级计算机由两部分构成:一部分是从 2013 年 6 月投入运行的 集群计算机系统 Anselm,另一部分是将于 2015 年初投入运行的更大规模的集群计算机系 统,后者有望跻身于全世界超级计算机一百强榜单。Anselm系统现已是捷克最大的集群计 算机系统,它作为DECI TIER-1 系统,是PRACE的一部分。有关这些系统的详细信息, 请访问 www.it4i.cz/hardware/en。IT4I 国家超级计算中心主要有六个研究方向,分别使用计算流体动力学(CFD)和有限 元分析/有限元法 (FEA/FEM) 等方法处理多种计算问题,包括实时交通分析/管理、洪水建 模/预测、空气污染建模/预防、分子动力学仿真和新材料建模等。面对形形色色的用户和应用,IT4I 意识到他们需要为超级计算中心用户提供一种可靠、 高性能的作业负载管理产品。在采购过程中,IT4I 要求提供高级作业调度程序和资源管理器 以及高级应用分析工具。在硬件供应商 Bull 的投标中,捆绑了满足这些要求的产品。在采购过程中对于作业负载管理器设定的标准是:较高的计算资源效率和利用率;稳健的批量作业和交互作业运行;持使用GPU/协处理器卡进行节点调度;支持作业依赖性和 作业阵列;确保操作的容错性和高可用性;具有用于调度与作业执行的静态和动态资源,包括软件许可证等外部动态资源;支持资源预留;支持回填;可向用户通知作业生命周期事件; 可对用户/用户组和资源进行限制或定额配给;拥有记录完备的高质量API,支持C和Python等常见编程语言;以及许多其它特定技术要求。“无疑我们需要一款高质量的调度程序——所有的超级计算中心都需要这样的程序,因 为确保资源利用率达到最高是计算中心成功的关键,”计算中心主任Martin Palkovič说道。“当你投入如此多的时间、资源和精力来打造一个超级计算系统来支持数以百计的用户需求时,就应当确保作业负载管理系统可靠无误,能够提供你需要的性能。”

IT4I 国家超级计算中心内的群计算机系统

IT4I国家超级计算中使PBS Professional管理Bull超级超级计200多位计用户PBS Professional易于实施和使可靠性极高这些都是使其脱颖而出的关键优势该中心还采用了PBS Analytics并计划随集 群机使用规模的扩大,对更多的产品进行考察评估。

为满足调度程序的严格采购要求Bull的专家对很多商用源产品进行了评估最后决定推荐Altair PBS Professional®作为作业负 载管理器。

“要实现高质量大规模的作业负载管理PBS Professional 是极佳的选择Bull ISV 盟主任 Olivier David 说道们将 PBS Professional bullx 超级计机套装紧密集成,配以经过优化的 bullxMPI,可保证用户用在 bullx 超级计算机上的高利用Bull Altair 两家公司长期以来都为 HPC 市场呈献了很多广受赞誉的解决方案这次联袂为客户的解决方案不但彰显了高性能和高稳健性, 而且适用于规模庞大的配置

IT4I 超级计算服务部总监 Branislav Jansík 对该决策进行了定,他说我们有很多选择但是 PBS Professional 提供解决方 案是最为先进成熟的方案之一,我们很高兴 Bull 选择在其品中使用这款调度程序

Jansík 补充道我们已经能够熟练使用 PBS Professional 对我们在大学的 HPC 集群行作业调度。不过,由于我们现在运作的 系统的规模巨大我们想要重新开始让供应商提供的新系统能够搭载他们能想到最好的调度程序令人高兴的是PBS 依然脱颖而 出

凭借以往使用 PBS Professional 的经验IT4Innovations 超级计算服务部的专家为所需的新调度程序定义了功能标准Branislav Jansík解释说PBS Professional 在功能性上设定了一个,我们选用的调度程序在功能上至少不能逊于此标准

最终,由于 PBS Professional 易于实施和使用,供应商决定选择 PBS ProfessionalPBS Professional 易于安装和使,而且它 能满足我们全部的功能要求Branislav Jansík 说道现在我们的用户可以完全依靠这套作业负载管理系统,而我们可以充满自信地 应对系统规模的扩张

目前,该中心的所有研究人员都使用 PBS Professional 配和利用 Anselm 超级计算的计算资源AnselmBull提供的一款x86 集群计算机,运算速度值约为94万亿次浮点运算/秒。

PBS Professional Bull 安装的形式提供所以中心的用户可以迅速开始工作IT4I 能够在项目初期阶段分析用户和运行需求, 然后根据用户的需要对该产品轻松地实施定制。

“有了PBS Professional们可以快速创建插件和序/结语脚本确保最佳资源使用率增强安全性以符合规范要求并使计算 节点在作业使用后仍保持原始、一致的状态IT4I 超级计算服务部副总监兼高级管理员Filip Staněk说道为满足户需求,我们需要完成高度复杂的定制工作,而 PBS Professional 让这些得易如反掌

IT4I 国家超级计算中心还实施了 PBS Analytics,该软件随决方案进行预安装,用于用户分析和报告。对于每个超级计算中心来说有必要准确掌握用户和项目所消耗的分配资源并相应地收取费用PBS Analytics 提供高级分析和报告功能可让我们更好地了解资源使用细节和项目未来的负载Martin Palkovič说道。

结论

IT4I 国家超级计算中心管理员的话来说,选择 PBS Professional 最大的好处在于操作员能够迅速轻松地适应和使用这款程序。用户可以很快熟悉并上手使用 PBS ProfessionalFilip Staněk 说道我们清楚,是 Altair 让我们有机会获得一流持服务,而这也是PBS Professional SLURM Torqueover 等开替代产品相比所具有的独特优势

目前 IT4I 国家超级计算心的用户中有超过 100 跃用户只通过 PBS Professional 这一种途分配和使用集计算资源。Anselm 集群上每天都要安新的应用程序,所以该中心计划对 Altair 的其它技术进行估,以备未来扩展之用。

PBS Professional 运行的大分应用程序均为用户编写的代码,或是像 OpenFOAMParaView Octave 这样的开源件。但系 统中现已部署了ANSYSEnSightLS-DYNAMATLAB COMSOL等商用软件除此该中心还计划部署VASPWien2K等 其它软件。该中心主管Martin Palkovič说道“我们确信PBS Professional就是我们超级计算系统的正确选择

关于Altair公司

Altair公司是世界领先的工程设计技术的开发者之一,也是一家具有全球深厚工程技术底蕴的优秀CAE工程公司。Altair 公司拥有多元化的业务主线,其技术涵盖高端CAE仿真和优化技术、数据管理及流程自动化、高性能计算与网络计算技术,同时具备一流的产品设计、流程定制、二次开发等咨询服务能力。Altair目前为私人所有,总部设在美国底特律,在全球拥有1800多位员工,分支机构遍及美洲、欧洲及亚太地区。凭借其在产品设计、先进CAE工程软件开发和网格计算技术等方面拥有27年的经验,Altair不断为各个行业的客户创造竞争优势。http://www.altair.com.cn



鲜花

握手

雷人

路过

鸡蛋

最新评论

360网站安全检测平台