自动化综合运维监管平台的设计与构建

所属栏目:自动化论文 发布日期:2017-04-20 11:42 热度:

   随着科技的发展,信息系统也在不断发展着,很多行业和职位上都会用到信息系统和一些自动化技术,这些技术给工作带来 很大的便利,也节省了人力。本文主要论述了自动化综合运维监管平台设计与实现。

自动化博览

  《自动化博览》(月刊)创刊于1983年,本刊是由国家一级学会——中国自动化学会主办、全国发行的大型刊物。集自动化控制技术、控制装置、计算机、网络通信、仪器仪表、传感器、执行机构、办公自动化、楼宇自动化、计算机集成制造系统、机电一体化等工控产品应用于一体,突出实用自动化技术。

  随着信息化系统建设发展,IT设备不断增加,部门业务捆绑的日益紧密带来了管理分散、信息孤岛等问题。基于面向对象的设计思想,分析了IT设备管理对象、IT设备与部门业务的联系,详细设计了消息服务总线、面向对象数据库以及平台功能等关键技术,设计并实现了自动化综合运维监管平台。实际应用表明,平台具有灵活的可扩展能力,为定制化开发提供了有力的数据支持,提高了综合监管的灵敏度,降低了开发成本。

  基金项目基金项目:

  作者简介作者简介:吕德奎(1983-),男,山东菏泽人,硕士,中国电子科技集团公司第二十八研究所工程师,研究方向为公安领域信息化建设;崔艳军(1988-),女,山东菏泽人,硕士,中国电子科技集团公司第二十八研究所助理工程师,研究方向为公安领域信息化建设。

  0 引言

  我国信息系统建设发展很快,不乏如ERP、CRM、财务、营销等核心软件,电信、电力、公安等单位更是建设了多达上百个正在运行的应用系统。随着政府、企事业信息部门建设需求的不断拓展,新的系统陆续上线投入运行。信息化在提升核心竞争力的同时,对其基础软硬件环境的支撑能力也提出了越来越高的要求。一方面提供信息服务的IT软硬件种类与数量不断增加;另一方面,IT软硬件的运行和企事业各部门业务的捆绑越来越紧密。IT软硬件承担的责任越来越重,对信息部门的系统安全、运营和维护管理也提出了更高要求,迫切需要综合性、自动化的综合运维监管系统[12]对其进行支撑。

  自动化综合运维监管平台是一个一体化、综合性的监控与调度平台,涉及服务器、中间件、网络设备、存储设备、安全设备、数据库等基础设备与软件的实时运行状况及统计分析,平台建设目标是建立一个稳定、高效、灵活的信息系统运行监控和调度管理平台,为企业各信息系统正常运行提供有力支撑,提高运行效率及服务质量,降低运营成本。

  本文利用面向对象思想,提出了适用于多行业信息部门的综合运维监管平台。对系统设计目标作了阐述,对架构和功能进行了详细设计。在某大型物联网示范园进行了应用,较好地解决了信息调度管理分散、管理效率不高的问题,为类似工程提供了建设思路。

  1 设计目标及原则

  1.1 设计目标

  系统目标可分解为3个层次:

  (1)实时性:①实时掌握信息设备、信息系统的运行情况;②及时发现故障与异常,并迅速定位,尽快解决;③及时发现入侵、病毒等安全问题及安全隐患,并迅速响应;④通过运行分析,调整运行策略,提高系统运行效率;⑤通过安全分析,调整安全策略,提高系统安全性。

  (2)可靠性:①通过流程保证故障、异常、隐患由合适的人采用合适的方式闭环处理;②促进巡检、变更工作的标准化、规范化;③通过流程运行考核,促进运维质量和运维效率的提高。

  (3)指导性:①优化现有信息基础设施运行性能;②提升系统安全性,降低安全风险;③预测并计划信息基础设施需求;④考核并不断提升服务水平。

  1.2 设计原则

  (1)充分利用现有产品及技术。在信息运维领域,已有大量的指导理论以及适用于不同管理域的各种产品,从管理域的角度可分为:网络管理产品、系统(主机、数据库、中间件)管理产品、应用管理产品、安全管理产品等。上述产品分别在网络、系统、应用与安管等领域提供了成型的解决方案。系统设计一方面要汲取现有的技术与经验,另一方面要兼顾已有系统实际,在现有产品与技术的基础上,创新构建自动化综合运维监管平台。

  (2)充分利用已有项目建设经验。这些项目奠定了理论与实践基础,积累了建设实施经验。

  2 系统设计

  本文从基础设备、应用系统和数据资产3个方面进行统一设计,采用面向对象的设计思想、开放式的SOA架构[3],该模式一方面支持异构数据源,另一方面最大限度地把物理模型转为逻辑模型,适用于多厂家数据集成,具备灵活的动态扩展性。

  2.1 顶层架构设计

  根据已有IT运维系统建设成功经验,结合本平台的特点以及未来信息化发展预测,需建立一个与业务无关的综合集成服务框架,在此之上构建综合视图、专项监控视图、管理人员视图等分类业务功能组件,以达到快速响应业务需求变更的目的。平台分层架构如图1所示。

  统一消息服务总线:提供消除不同应用之间的技术差异,让不同的应用服务器协调运作,实现不同服务之间的通信与整合;统一信息库:提供统一的监控对象属性配置数据、数据字典索引和各类关键绩效指标数据(KPI);统一查询视图:在统一信息库基础上建立统一的Oracle视图数据管理,简化逻辑转换;监管对象化管理:依据逻辑视图上的监管对象对各类IT设备资产进行组件化开发;统一展现:通过权限或席位分配,不同角色访问不同监管对象组件。

  2.2 消息服务总线设计

  SOA系统有3种基础组件:消息服务总线、信息转换/处理引擎和数据存储库,其中因为消息服务总线是所有其它组件交互的中介,所以是最重要的组成部分。本文通过使用消息服务总线,为ERP、CRM等应用提供一个平台,实现无关的服务接口,可以在不更改或少量更改代码的情况下,以一种无缝的非侵入方式使企业已有的系统具有全新的服务接口,如图2所示。

  消息服务总线是一种通信工具,可以在机器之间互相传输消息、文件等。本文利用消息总线把各被监控对象产生的指标数据向消息总线发出,由消息接收方进行数据接收、转换以及保存到数据库操作。为了避免消息丢失,平台对消息总线提供了一定的持久化存储和灾备功能。   2.3 面向对象数据库设计

  面向对象数据库[4],把面向对象的方法和数据库技术结合起来,可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。本系统中采用Hibernate和Oracle相结合的形式实现面向对象数据库存储。

  根据要管理的基础设备、应用系统和数据资产3大类数据,采用模型化细化为:网络设备、服务器设备、存储设备、机房动力设备、机房消防设备、门禁、安全设备、中间件、数据库以及应用系统等10类模型,并采用Hibernate对象与Oracle数据表进行相互映射。相对不变的内容,如采购时间、设备名称等以对象静态属性的方式存在数据库表内,采用横表实现;另外一些变化频繁的,如服务器的CPU利用率、磁盘利用率、应用系统使用状况等内容以关键指标(KPI)的形式保存在数据库表内,采用总表实现。关键指标和模型对象之间采用字典进行索引与管理,模型对象产生的数据称为资产数据,关键指标产生的数据分为实时数据和历史数据两类,关系表如图3所示。

  2.4 自动化运维功能设计

  根据信息化系统建设特点,自动化综合运维将10类模型数据统一监管、综合展现,实现相关性影响分析等功能。本文在运用面向对象思想对IT运维资源进行对象模型化拆分、属性信息规划后,结合平台建设目标,从最终用户角度把平台应用细分如下几大功能区:

  (1)运行监管。以图形视图和页面相结合的方式,综合展现信息运维的不同纬度实施监控,包括:网络拓扑、网络设备、网络链路、网络端口、数据库、中间件、服务器等实时运行指标数据及对象模型的属性配置数据。

  (2)应用监管。主要从系统运行、业务数据的层面,对公司重要的业务系统进行统一监管。监管的业务系统内容主要包括:系统配置数据、性能数据、关键指标、在线人数、业务拓扑关系等反映业务系统运行和实用化现状的信息。

  (3)安全监管。通过监管安全事件数量、病毒感染机器种类、最新漏洞统计、地域风险等数据,反映园区设备与系统运行的安全状况。

  (4)机房监管。通过监管机房的动力设备、环境设备、门禁等资源的实时温度、湿度、门禁异常等指标,反映机房当前运行的安全状况。

  (5)运维监管。从企业运维的角度出发,通过运维服务时产生的工作单、工单解决率、工单解决时长等关键指标,综合分析以反映企业运维现状。

  3 实际应用

  物联网,即“物物相联之网”,指通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把物与物、人与物进行智能化连接,进行信息交换和通信,以实现智能化识别、定位、跟踪、控制和管理的一种新兴网络。物联网不是一种物理上独立存在的完整网络,而是架构在现有互联网或下一代公网或私网基础上的联网应用和通信,强调智能应用。

  南京某大型物联网示范园建设了一套面向主题的大型统一信息库,主要集成10大类模型关键监控指标数据于一体,基本实现了信息运维工作的规范和统一。在此基础上,进行了平台的实际应用,采集了多个原始关键指标:服务器指标数20余个、数据库指标数30余个、中间件指标50余个、网络设备类指标近100个等。通过对原始关键数据的进一步分析,平台实现了设备类之间的关联统计、关联分析、故障定位和综合展现。

  设备采集到的信息通过搭建好的局域网或广域网,将信息上传至网管服务器。通过与IT综合管理系统实时联动,利用智能分析和影响度关联技术,将机房环境中的温湿度、漏水、电源、UPS、烟雾、视频监控、消防及门禁等,与用户的网络设备、应用、服务等IT 资源关联在一起,并完整集成到业务模型。通过智能业务模型,系统将自动对各项业务以及承载业务的各个设备、服务器、应用等资源进行全面分析,在业务结构中清晰反映机房环境对整体业务的影响程度。任何一个业务中的细小变化和端倪,都能通过系统实时组合成数据或信息,进行实时直观展现,如整体业务健康度、可用率等。当机房环境出现异常时,系统则会根据不同的异常等级进行告警,并通过多种告警方式及时通知运维人员,从而保障各设备、业务系统的高效运行,大大降低了业务系统运行风险。

  系统将采集的数据在IT综合管理系统的监控指标列表中集中展示。通过指标一览,可以直观了解各指标的类型、当前值、当前状态、异常规则、监控频度等。不仅如此,用户还可以通过增加示意图元、示意链路的方式建立示意拓扑图来模拟机房实际物理环境,将机房环境实时展现。通过机房示意拓扑图,可以了解到机房环境中的温度、湿度、漏水、烟雾探测、视频、消防设备、空调与门禁等设备的运行情况和分布情况。另外,还可以根据每个示意图元的颜色状态来判断该设备的异常等级情况。当设备发生故障时,在机房示意拓扑图上可以直观看到相关设备的异常提示,直接点击异常设备则可以自动关联到该设备的详细信息。

  通过建立综合运维监管系统,本平台主要解决了以下几个关键问题:

  (1)基于面向主题的统一信息库,解决了数据管理分散的问题。在此之前,各个部门、各个业务,根据自身需要建立了越来越多的应用系统,采购了大量的IT设备,这些设备和应用系统运行环境各异、管理部门分散,很难做到集中管理、集中运维,通过此综合监管平台建设,在一定程度上解决了管理分散的问题。

  (2)基于展现视图组件化构建,解决了不同管理层次的数据展示需求。综合监管平台涉及大量的跨部门、跨平台的各类监控数据,系统面向对象从公司各层领导到基层一线运维人员及管理员等,通过组件化的视图实现方式,针对不同的人员实现不同的展现需要。

  (3)基于统一信息库面向对象数据,解决了故障根源定位、故障影响范围分析等问题。每个设备告警或系统运行告警,均不同程度影响其它设备运行,通过建立综合监管平台,采用面向对象主体监控数据,能够很方便地梳理出告警的根源、产生原因以及解决方案建议,甚至能够分析出告警的影响范围。

  4 结语

  本文探讨了数字化园区综合监管运维系统的对象化建设问题。把监控设备资产与软件进行对象模型化处理,一方面有利于与第三方厂家进行数据集成,另一方面有利用适应各种复杂的桌面终端展现应用。各行各业在信息化建设达到一定标准后,发展方向和发展重点即转入综合监管平台建设,这是信息化建设的一个重要阶段性标志。随着综合应用的日益成熟,综合监管建设技术也将更加先进、应用也将更加深入、综合性也会更强。

  参考文献:

  [1]寿增.调度自动化运维监管系统的设计与应用[J].电力信息与通信技术, 2014(2):2629.

  [2]孙建庆.信息系统运维综合监管平台设计[J].电力信息化,2009(3):125128.

  [3]刘翔,刘家红.基于SOA架构的公安应用集成平台的研究与实现[J].计算机工程与设计,2007(18):2830.

  [4]陆宁,马智亮.利用面向对象数据库与关系数据库管理IFC数据的比较[J].清华大学学报:自然科学版,2012(6):119123.

文章标题:自动化综合运维监管平台的设计与构建

转载请注明来自:http://www.sofabiao.com/fblw/ligong/zidonghua/35564.html

相关问题解答

SCI服务

搜论文知识网的海量职称论文范文仅供广大读者免费阅读使用! 冀ICP备15021333号-3