保障数据中心核心业务系统安全高效可靠地运行,是信息系统管理部门的重要职责和伟大目标,也是IT人的使命所在。IT人拥有不可推卸的权责。
数据中心核心业务系统,从逻辑上看包含多个不同的应用组件,从物理上看运行在多个不同的物理服务器上,数据在不同的设备或系统间流动。
要实现上述目标需要对数据中心进行全方位、多层次的综合监控,需要对问题处置和应急指挥进行科学管理。
本项目主要针对解决数据中心管理和运行工作中的实际问题,主要作用表现在以下三个方面:
监控对象一体化
实现机房动力、环境、安保、小型机、服务器、网络、安全、存储设备、数据库、中间件、应用软件等跨平台一体化的实时状态、性能、事件、配置等数据的采集、正则化汇聚和保存。
监控展示一体化
所有监控对象的状态、性能、事件都集中的以三维效果图的方式展示出来,更方便、直观、高效的让数据中心工作人员准确的定位故障发生位置并处理所发生的紧急情况。
监控管理一体化
一体化集中监控管理系统实现7X24小时实时监控和报警、知识库支持的实时事件故障处理,自动化管理报表生成,资产管理、知识管理、机房管理等日常管理功能,让工作人员在日常数据中心管理维护上更加轻松,以避免在不必要的环节浪费大量人力、物力,让工作人员将主要精力放在数据中心内核心业务上来,提高数据中心的整体业务效率。
一体化集中监控管理系统的实施,将保障数据中心核心业务系统的安全、高效、可靠地运行,极大的提高数据中心管理工作的自动化、信息化工作效率,为更好的服务于社会提供强有力的保障。
通过需求调研,本建设项目的需求包括两个方面,一个是监控管理系统的功能需求,另一个是监控范围的需求,包括具体的监控对象,监控指标。
从功能上讲,本项目需要实现监测、控制和管理的一体化。具体包括:三维效果展示、事件告警管理、知识库管理、资产管理、机房值班管理、统计报表等。
从监控范围上讲,本项目需要实现的监控类别包括: 动力、环境、安保、小型机、服务器、网络、安全、存储设备、数据库、中间件、应用软件等,从而实现一体化集中监控的目标。
从应用软件的层面看,IT一体化集中监控管理系统共由六大子系统构成,包括Web客户端、管理客户端、Web服务、监控服务器、后台服务进程和监控代理。各子系统具体功能及相互关系如下图:
系统上线运行之后,使用最多的就是Web 客户端。它提供了监控管所需要的一切。
管理客户端是增减监控对象、调整监控策略、优化监控代理部署和监控策略的强大工具。
Web服务包括工程文件、数据中转、自身监控、备份恢复、升级许可等诸多服务。除了数据中转服务外,Web服务不依赖后台的其它任何服务。它能够对系统的其它组件进行起、停操作和状态检测,从而实现IT一体化集中监控管理系统的持续运行。
监控服务器是IT一体化集中监控管理系统中最核心的子系统。除Web客户端外,其它四个子系统都与监控服务器子系统直接交互。它内嵌强大的实时数据库,拥有侦听器、数据匹配、事件生成、数据保存、数据访问、连通检查和SNMP轮询在内的高性能的内核服务。例如,它的数据匹配引擎,可以同时快速匹配出几乎任何代理发送过来的任何格式的数据;它的事件生成引擎按事件生成规则快速生成事件;它的数据保存服务按照保存策略快速地将监控指标的实时数据保存到关系数据库。
后台服务是由一组可以独立安装在不同机器上的程序组成,包括告警服务、策略执行、协议执行、级联服务、业务监控接口、动环监控接口等。监控服务器加后台服务的设计,即保持了监控服务器的微内核又拥有了各种后台服务安装部署的灵活性。
共济IT一体化集中监控管理系统监控协议即支持由标准协议支持的监控对象,也包括非标准的监控对象。标准协议包括:SNMP、IPMI、WMI、SYSLOG等。非标准监控对象通过由各类脚本(例如perl)写成的监理代理来完成。这些脚本化的监控代理(我们简称“脚本代理”)即安全又高效,即可以本地部署,也可以远程部署,一切按需求灵活设置。
根据不同的监控管理需求,现提出两种系统架构:
² 单个中心机房IT监控:
IT一体化集中监控管理系统部署之后,分为客户层、服务层、业务层和采集层,通过四个层的实施,来实现综合监控和科学管理。系统部署的一个例子如下图所示:
经过部署后,四个层需要实施的内容有:
1. 客户层。客户层包含报警服务器(报警网关)、管理客户端和Web客户端。报警服务器部署报警网关,负责对外的电话、短信和邮件报警,需要单独部署一台服务器;管理客户端安装C/S客户端软件,主要负责监控应用服务器的配置和使用,需要单独为管理员配置一台服务器。Web客户端可以通过Web查看,只要网络连通,任何工作机都可以根据权限进行查看,针对本项目的特点需单独提供一台服务器进行WEB浏览,同时需要将Web浏览界面图像信号传送给大屏系统,展示到大屏中。
2. 服务层;服务层包含综合监控应用服务器和综合监控数据库服务器。综合监控服务器需要高性能服务器主机和Liunx操作系统,可保证更高的稳定性和性能,负责部署综合监控平台、工单管理子系统、报表子系统、系统管理服务、联动服务、Web服务、数据配置、存储和报警服务和事件日志查询服务。综合监控数据库服务器需要高性能服务器主机和数据库服务,用于存储监控的历史数据和事件、配置信息等数据。
3. 业务层;业务层包含监控的各种业务系统,包括税收征管业务系统、网上报税业务系统和货运发票业务系统等。这些业务系统的运行状态是监控的核心,其它方面的监控都是辅助于业务系统监控。业务层监控的功能是综合监控系统与各个业务系统通讯,获取业务系统状态。
4. 采集层;采集层包含各种硬件、系统和动力与环境。通过对本层的监控,可以更加准备的分析出业务出现故障的原因和实现预警功能。本层采用分布式设计,能够灵活增减监控设备,而无需在软件上修改代码,只需要配置即可。
² 多机房联网型的IT监控:
对于联网型的监控,可利用IT一体化集中监控管理系统的级联功能,实现各前端机房内设备的集中监控管理。部署同样分为四层:客户层、中心服务层、本地服务层和现场采集层。部署图如下:
1. 客户层:客户层包含报警服务器(报警网关)、管理客户端和Web客户端。报警服务器部署报警网关,负责对外的电话、短信和邮件报警,需要单独部署一台服务器;管理客户端安装C/S客户端软件,主要负责监控应用服务器的配置和使用,需要单独为管理员配置一台服务器。Web客户端可以通过Web查看,只要网络连通,任何工作机都可以根据权限进行查看,针对本项目的特点需单独提供一台服务器进行WEB浏览,同时需要将Web浏览界面图像信号传送给大屏系统,展示到大屏中。
2. 中心服务层:中心服务层包含中心应用服务器和数据库服务器。中心应用服务器需要高性能服务器主机和Liunx操作系统,可保证更高的稳定性和性能,负责部署针对所有前端站点机房的综合监控平台、工单管理子系统、报表子系统、系统管理服务、联动服务、Web服务、数据配置、存储和报警服务和事件日志查询服务。综合监控数据库服务器需要高性能服务器主机和数据库服务,用于存储所有前端站点机房监控的历史数据和事件、配置信息等数据。
3. 本地服务层:本地服务层包含一台前端应用服务器。前端应用服务器负责部署本机房内设备、操作系统、业务系统以及动环系统的综合监控,并把监控信息即时传递给中心服务层。本层采用分布式结构,增减所监控前端机房数量时,只需增加或减少相应数量的前端应用服务器。
4. 现场采集层:现场采集层包含各种硬件、系统和动力与环境。通过对本层的监控,可以更加准备的分析出业务出现故障的原因和实现预警功能。本层采用分布式设计,能够灵活增减监控设备,而无需在软件上修改代码,只需要配置即可。
一体化集中监控管理管理系统分为四个层次结构,
系统四层结构如下图所示:
软件架构中每个层次的作用是:
1. 显示层;本层主要是提供给用户图形交互界面,将大量的复杂的监控数据通过图形化的方式分层次和优先级地展现给管理员,使一体化集中监控管理系统的监控更加简单和易用。显示层主要实现了客户端功能,具有C/S和B/S双重架构,包括管理客户端和Web客户端。管理客户端具有系统管理功能;Web客户端通过友好的页面展示监控内容,显示故障报警,用户可以通过Web浏览获知整个系统的运行状态。
2. 应用层;本层是核心服务程序,负责维护采集层的数据、提供显示层浏览服务和报警功能。应用层包含业务管理模块和报警网关模块。业务管理模块负责从采集层获取监控数据,经过处理,将报警数据进行显示和发送给报警网关模块,并对数据进行记录,以便报表分析处理。报警网关模块接收到报警后,通过电话、短信或Email发送给管理员。应用层各个服务都是监察的核心模块,系统设计了软件看门狗服务,自动监测各个服务的运行状态,当运行状态下一体化集中监控相关服务出现异常,将由软件看门狗服务自动重启异常服务,恢复监察业务。
3. 采集层;本层负责采集监控数据。采集层根据前端不同的监控对象采用不同的采集方式。针对动力与环境监控,采集方式多采用串口RS232方式;针对业务监控、服务器、网络、存储和通讯的监控,多采用网络方式。
4. 设备层;包括被监控的设备和系统,也包括各类专门的监控工具。 |