联系电话:0531-62388888
最新公告:

HYDO智能运维管理平台

联系我们Contact

更多>>

济南申瓯通信设备有限公司

电话1:0531-62388888   

电话2:0531-62388889

电话3:0531-62388886

电话4:400-117-1178

地址:济南市历下区花园庄东路16号数码港公寓7H-2


 

HYDO智能运维管理平台

更新时间:2018-10-12 点击数:2182

HYDO智能运维大数据管理平台采用了大数据、云计算、人工智能、物联网的最新研究成果和技术,实现了大规模数据中心的集中管理、实时监控、智能优化、安全运行。通过对本地、异地数据中心机房的服务器、存储、网络、动力环境等设备应用服务的运行情况实时监控,精确采集、分析、判断系统性能,采用预防性警示、故障自动报警和处理、运维数据分析等措施,综合大数据分析和计算的成果,向管理、使用和维护人员提供科学、合理的决策信息和升级改造建议,确保大规模数据中心机房稳定、安全、高效地运行。


系统架构

本次建设将采用B/S模式三级架构,按照实现逻辑的不同,设计为自下而上的三层总体结构,分别为监控实体层、监控抽象层、监控逻辑层。

 

1)监控逻辑层 主要包括具体实现具体监控的一些系统功能,如监控对象管理、调度实现、WEB展示、报警通知等。其中对象的管理主要是用于对监控对象属性的定义;调度管理用于实现系统负载平衡的最优调度;展示部分是基于WEB程序通过Apache服务提供统一的监控管理界面,用于集中展示监控信息,给管理员一个全面实时的系统运行状况;权限管理实现对用户访问和操作权限的分类管理;报警功能实现短信、微信、邮件、MSN等方式的及时故障通知。

2)监控抽象层:是由各种检测模块组成的一个虚拟层次。检测模块扮演了连接监控逻辑服务与实际被监控对象之间的桥梁,起到承上启下的关键作用。抽象层主要包括用于数据检测的各种监控模块和调用这些模块的代理程序。监控主程序通过调度管理模块运行监控模块命令,向远程监控主机发送监控请求,并将返回的检测结果按照既定格式存储。

3)监控实体层监控实体层是由各种类型的监控对象组成,包括服务器、交换机、路由器、打印机、UPS、门禁、精密空调、温湿度等设备,也可以是应用服务如Apache、共享存储、PBS服务等。为了便于对这些对象进行管理,按照实际应用,将这些监控对象进行分区管理,可以分为网格、集群、大数据、云计算、GPU应用等监控区域。


集中大屏展示

提供大屏展示功能通过DashBaord集中展示IT硬件设备和业务系统等资源运行情况、性能状况TOP分析等内容通过饼图、柱状图、曲线图、仪表盘等大屏可视化功能使部门领导、管理者、运维人员和值班人员能迅速掌握整体IT设备运行状态。大屏可支持轮播功能,可根据需求定制展示内容

 

网络设备监控

实现对思科、华为、华三、Juniper、锐捷、迈普、天融信、深信服等主流厂商网络设备、安全设备进行集中监控。通过SNMP、ICMP、ARP等协议自动采集设备基本信息、设备接口配置信息、设备之间物理连接关系等,对网络设备监控指标包括设备性能信息,如:设备IP、设备名称、厂商、OID值、CPU负载、MEM利用率,端口、总流量、出流量、入流量;帧流量、广播流量、丢包率、带宽占用比等监控信息。

提供网络拓朴自动生成功能,实时展示网络中各节点的运行情况,并可查看设备基础信息、状态信息,执行测试命令等功能。

 


服务器主机监控

实时获取主机信息(机器名、IP地址、机器品牌、CPU型号、内存、硬盘等)、网络连通性等,并监控其运行状态。HYDO运维平台可监控服务器CPU性能指标、内存工作状态、硬盘工作状态及占用情况等,如磁盘监控,可监控物理磁盘、逻辑磁盘、虚拟磁盘等的相关属性,磁盘使用率、数据传输率、平均等待时间、平均繁忙时间等性能指标,当指标超过预设阈值时,系统自动报警;同时也可设定磁盘的使用限值,当空间使用大于预设值时会自动报警提醒。



 服务器硬件自适应监控功能

HYDO运维平台支持多品牌型号的设备并能自动识别设备配置、品牌、型号、及CPU品牌型号等。

所有主机的运行状态信息以表格的形式,以不同颜色来展示主机的全部信息和状态。主机类型包括Linux主机、Windows主机、HP-UXAIXSolaris主机、OS400主机等,监控内容包括主机的在线状态、CPU利用率、内存大小及利用率、磁盘空间大小及利用率、主机进程状态及其对CPU和内存占用情况、所提供的关键服务状态、主机的网络接口流量等信息。


主机组监控管理

主机组是指一台或多台主机构成的组,创建主机组可使配置更简单或是为完成特定目的 而在页面中显示。可实时查看所有主机组的状态汇总或单独查看某个主机组详细信息。 

主机组状态摘要页面动态显示出现的故障或告警信息。

 

动力环境监控管理

1UPS电源监视

实时监视UPS整流器、逆变器、旁路、负载等各部分的运行状态与参数

2)精密空调监测

实时监控精密空调压缩机、风机、水泵、加热器、加湿器、去湿器、滤网、回风温度和湿度等的运行状态与参数,并可对精密空调实现远程开关机的控制(能监测到的具体内容由厂家的协议决定,不同品牌、型号的精密空调所监控到的内容不同)。同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。

3)温湿度监测

实时监测机房区域内的温度和湿度值,同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。


业务系统监控与管理

1)支持对Redhat LinuxHP Unixcentos、麒麟LinuxWindowsSolaris AIXAndroid等主流操作系统监控。 

指标:基本信息、IP地址、系统版本、状态、CPU负载、内存利用率、进程、进程状态、文件系统、磁盘空间使用率、事件与错误日志等。

2)数据库管理,对OracleSQL ServerSybaseDB2Informix MySQL等主流数据库进行监控和管理,包括:数据库基本信息、IP地址、数据库版本、数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。

3)中间件管理,支持对WebLogicMQTomcat等中间件进行管理,指标包括:配置信息、连接池、线程队列、负载监测、通道情况监测等。 

4)应用管理,支持对HTTPDNSDHCPSMTPPOPFTP等各类应用进行统一监控,包括:基础信息、状态、会话状态、会话数、上传下载速度、关键字检测等。 


虚拟机监控与管理

VMware虚拟集群监控主要划分为三级: 

(1) DataCenter和Cluster级别的中心服务器监控。

2ESX宿主机监控。

3)虚拟机监控   


 

异地分布式监控与管理

分布式需求:之前本地和那些处于异地远程的机房需要部署独立的监控系统进行运维管理。每一个机房都需要单独的系统管理员进行专门的日常监控和维护,大大增加了系统管理的难度和强度。 

分布式监控:跨地域分布式扩展模式,异地多站点的集中统一监控, 对每个机房中各种设备和服务进行有效的监控和报警,提高系统的利用率,降低系统运维强度和复杂性。 

 

智能运维大数据功能

HYDO运维平台自动收集监控节点的响应时间、服务质量、网络状态、网络流量、性能指标、故障频率及处理等海量运行数据,进行数据关联、挖掘与分析,对设备及业务系统进行异常检测,及时预警提醒,给出处置建议。全面展示数据中心的运行状态,对运维工作给出经验建议,并能给出机房整体运营优化及规模扩展建议。


数据统计与报表管理

运维平台对被监测信息有多种展示形式,包括:饼图、曲线图、柱状图、线面图、数据表、仪表图、PDFEXCEL文件等;并提供历史数据的查询和导出;统计时段单位可以是年、月、日、小时,分钟等。可提供所有被管主机、主机组、网络、数据库、中间件、其他服务等对象的运行状态、性能指标、告警、资源统计报表,方便用户直观、多角度了解当前整个IT资源的运行情况。

 

 

报警管理

HYDO智能运维平台经过多年的应用和改进,建立了高效的报警机制,并采用了灵活的、清晰的报警策略。

HYDO运维平台提供自定义告警设置功能,可设置告警阈值,告警条件,主动屏蔽告警等方式进行过滤处理,过滤掉用户不关心的告警信息。系统支持多种灵活报警手段,如微信、邮件、短信等,发现问题第一时间通知系统管理员。


运维数据的备份与恢复

(1)所有配置信息、历史故障数据可以备份、导出和恢复。

(2)提供历史数据的清除机制,包括历史告警、性能数据、系统日志等

(3)能够定期清除指定时间段以前的数据;

(4) 能够支持手动和自动方式进行系统数据的备份;

(5) “定时任务”管理,可定时对系统进行数据的备份和清除。


上一篇:无

下一篇:无