浪潮信息ISPIM领跑数字化转型,助力中南大学智算平台实现自动化运维

2021-11-25 10:05:20

随着数字化转型的加快,高校教学、科研、管理和服务对算力的需求不断攀升,高性能计算成为继理论和实验之后开展科学研究的第三大支柱。浪潮信息作为全球领先的算力基础设施供应商,一直在致力于推进新基建的建设,以安全可靠的产品和优质的服务保障大规模数据中心安全、稳定、可靠的运行。


中南大学智算平台作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,拥有高达上千台各种类型的计算服务器,一方面满足了科研人员大量的计算资源需求,另一方面大量集中部署的计算服务器集群对管理和运维人员提出了新的挑战。由于运维人员缺乏自动化的运维管理工具,借助经验诊断故障,极易造成故障的漏判、误判。为此,浪潮信息为其提出了以ISPIMInspur Physical Infrastructure Manager)浪潮信息物理基础设施管理平台为核心的自动化运维解决方案。

ISPIM平台是浪潮信息根据市场需求,遵循NFV标准,自主研发的一款高可用、高性能、高可扩展、高可维护的行业数据中心物理基础设施管理平台。该平台具备资源管理、故障监控、性能监控、能耗管理、报表统计、拓扑展示、服务器故障诊断、自动报修、固件升级/配置、OS部署等功能,可保障数据中心安全、可靠、稳定的运行。

通过实地考察、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,浪潮信息研发工程师最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。通过部署浪潮信息ISPIM系统,中南大学智算平台实现了集中自动化管理,大大减轻了运维负担,通过对算力数据的精准获取、调度,使得算力的管控集中化、智能化。同时,运维人员通过ISPIM平台可随时随地监控整个平台的运行状态,故障报警能够以秒级的速度精准定位,保障中南大学的智算平台高效有序运转,节约了人力资源,运维效率大幅提升。

在未来,大型企业或组织对大规模计算服务集群的需求将持续增加,如何保障大规模数据中心安全、稳定、可靠运行成为关键。为此,浪潮信息将继续优化和完善ISPIM平台,助力各行业用户数字化转型。



上一篇:

下一篇:

关于我们

隆化百科网是领先的新闻资讯平台,汇集美食文化、体育健康、商旅生涯、投资理财、国际资讯、生活百科、等多方面权威信息

版权信息

隆化百科网版权所有,未经允许不可复制本站镜像,本站文章来源于网络,如有侵权请邮件举报!