某移动业务支撑网运营管理系统bomcv40规范-监控管理中心分册v内容摘要:

条目(可包含告警元素、告警级别、告警类别或告警节点等)进行过滤。 告警 显示 过滤用于过滤掉从底层提取的告警信息中监控人员认为不重要的信息, 只显示监控人员关心的告警信息, 从而减少 大量无用 告警的干扰,以提高监控与处理的效率。  告警查询  提供定制化的预定义告警查询功能  提供多种条件组合的告警查询 QBYXXXXXXX 13 预警管理 预警管理,是指除明确的故障告警以及性能告警以外,以历史数据为参考,引入简单的分析方法,通过对性能数据分析处理,发现潜在的问题,提前产生预警,预警可能是告警及故障的准确预判,也可能是正常运营状态下对非合理的运营数据的提示,目的是为运维人员及监控人员获得提前的问题感知能力,得到相对多的处理时间,提供防范问题发生的手段。 通过预警策略管理提供灵活的预警控制, 主要实现 IT 基础设施、应用软件及业务运行状态预 警的统一处理 、操作 功能。 预警 管理主要包括 预警策略管理、预警处理、预警操作 等功能。 预警策略管理 预警策略管理, 包括预警信息定义,预警策略配置,预警策略展现,预警策略查询等功能,通过预警策略配置的多样性和灵活性保证 预警的相对准确性和有效性,并通过告警策略的展现和查询,使运维人员及监控 人员对预警策略进行全面掌握。  预警信息定义,对预警信息数据分类和预警信息的内容及级别进行定义和管理;  预警策略配置,包括对预警的生成策略、预警推送策略进行统一配置管理。  预警策略展示和查询,提供对预警策略配置现状进行全景展示,并提供按条件查询。 预警信息定义  预警数据分类 按照预警数据所属资源的类别,将预警数据划分为如下类别: 物理类预警、 应用类预警、业务类 预警 、逻辑类预警、其他类预警。 针对每种类别的预警,根据预警信息的严重程度、影响范围以及与企业相应考核指标的关系确定预警级别,具体参考以下 2 级:重要预警 (Major)、一般预警 (Normal)。  重要 警 (Major):指预警信息的严重程度较高、潜在的问题发生的可能性较高,需要 5 x 8 小时处理的预警。  一般预警 (Normal):指预警信息的严重程度低、潜在的问题发生的可能性较低,可以作为运营问题分析关注的内容即可。 QBYXXXXXXX 14 建议预警级别与颜色的对应关系见下表: 表 23 预警级别颜色对应表 预警级别 颜色 重 要预警 (Major) 橙色 一般预警 (Normal) 黄色  预警数据内容 预警数据内容可以参考以下内容: 表 24 预警数据内容表 中文名称 说明 预警的序列号 产生预警消息的序列号 预警 KPI标识 包含单个或多个 KPI的标识 配置项名称 配置项 的识别名 预警发生时间 预警发生时间 预警确认时间 预警确认时间 预警清除时间 预警清除时间 原始 预警类型 原始 预警 数据中的预警 类型 原始 预警级别 原始预警数据中的 预警级别 预警 状态 预警当前状态 预警源 预警发生源 确认操作员 确认操作员用户名 清除操作员 清除操作员用户名 预警标题 预警标题 预警 内容 预警内容 预警策略配置 【功能 定义 】 预警策略配置的效率 ,是监控快速部署、提高系统监控效率的保证,同时可以极大地提高运维人员和监控 人员的工作效率。 【功能 要求 】 QBYXXXXXXX 15  预警生成策略 配置 多个相关的低级别故障类告警信息,按照配置策略自动生成相应预警。 对单个或多个性能数据进行分析处理,生成相应级别预警。 包括: (一 ) 趋势预警: 在特定的预警周期内 ,单个性能数据 趋势 变化幅度超过相应的阀值,则产生相应级别的预警;多个性能数据的 变化幅度超过相应的阀值,则产生相应级别的预警。 图 21趋势预警示例图 (二 ) 异动预警: 对历史数据进行处理,形成正常的性能数据周期性趋势数据,实际采集的性能数据与趋势数据进行对比,对变化异常的数据进行预警。 图 22异动预警示例图  预警推送策略 配置 预警推送就是通过丰富的预警推送接口,进行预警推送,对不同的运维管理人员可以推送不同的预警消息,可以按如下预警分类进行预警信息推送定制,如预警级 别、预警实体对象、预警实体类别、预警实体业务类别、预警实体地域属性等;运维管理人员、监控管理人员可以定制接收预警推送的时间段,按时间段进行推送定义,如在某时间段接受严重级平台类预警; QBYXXXXXXX 16 策略配置实现以下功能:  提供通用策略配置模板,包括生成策略模板、推送策略模板;  提供配置模版定制功能,新增监控实体类可以通过配置模版定制预警策略。  提供配置模版编辑功能,实体类的监控策略的变化,通过模版编辑进行修改更新;  预警策略配置可以部分或全部引用配置模版,也可以独立完成配置,独立配置优先与模板配置生效,保证预警 策略配置的灵活性。  支持通过统一的图形化的配置界面,实现灵活的配置参数设定。 预警策略展现及查询 【功能 定义 】 通过预警策略展现,使监控管理人员对被管实体预警策略的配置情况全面掌握,并通过设定条件,对具体的预警策略进行查询。 【功能 要求 】  按照预警策略类别等 进行策略预警策略 集中展现 ;  提供预警策略的查询功能,对预警策略作关键字查询,则展示与关键字相关的被管实体的预警策略;  提供预警策略报表统计 功能 ; 预警数据处理 【功能 定义 】 预警数据 处理 主要包含对预警数据的系统后台处理,包括预警数据规则处理、预警压缩、预警 信息 丰富、预警关联处理、预警推送等。 对 来自平台 类、 应用 类、业务类 的预警事件 进行统一的、可配置的规则化处理。 【功能 要求 】  预警规则处理  根据预警生成策略配置,对故障告警数据、性能数据、业务告警数据等进行规则化处理,生成相应的预警;  根据预警推送的略配置,进行预警自动推送处理;  预警压缩 QBYXXXXXXX 17  预警压缩是对不同时间产生的相同预警,将其压缩成一条预警信息,同时累计该预警的次数,第一次预警发生时间和最后发生时间等。  在进行预警压缩时,应只保留一条压缩后的预警信息,应更新预警记录的发生次数、最后发生时间等信息。  应能 够灵活的定义压缩规则,通过组合不同的预警信息字段设置预警压缩规则。  预警 信息 丰富 应能够实现与资源数据的实时关联,对预警信息进行丰富,增加对预警信息的描述,如对于系统预警,增加相应的厂家、型号设备和描述信息等。  预警关联处理 提供用户灵活定义预警关联规则的功能。 通过组合不同的预警信息字段设置预警关联处理规则。 根据日常维护的需要设置设备维护时间,在此期间系统应对其产生预警信息进行特殊处理,如增加维护期标识、降低预警级别等。 根据维护的实际情况,迅速计算出各类历时信息,如收到预警到预警确 认历时、预警发生到预警恢复历时等。 提供用户灵活定义各类预警历时的计算规则。  预警推送 系统提供预警 推送 功能,将预警信息以各种手段(手机短信、 EMAIL 等)转至指定的维护人员,应能够灵活的设置 推送 条件、预警内容等。  预警 推送 条件 预警 推送 的设置条件:预警级别、 预警发生时间、预警标题、预警 类型、预警设备所在地区、预警内容关键字模糊匹配、 需要通知的相关系统和人员等。 管理员可以存储设定的预警推送条件,并可对预警推送 条件 列表进行增、删、改、查等操作。  预警 推送 内容 可以根据预警数据的内容自由定义 推送 内容, 并能手工编辑内容。 预警操作 【功能 定义 】 预警操作面向 运维人员和 监控 人员提供预警操作管理,包括 预警问题定位、预警确认、预警QBYXXXXXXX 18 清除、 预警推送、 预警显示过滤、 预警查询 等操作。 【功能 定义 】  预警 问题 定位 提供对重要预警的问题定位能力, 应与 资源管理、业务管理中心、运营分析中心提供的相应查询、展示、分析能力相结合,进行预警问题的粗粒度的定位,并根据问题潜在的影响范围和影响程度,进行相应的推送操作。  预警 确认  预警确认主要是对预警承载的信息予以认可,以形成有效的预警。  系统应产生确认时间等确认信息。  支持预警 批量确认的功能。  预警清除  主要是对于系统中已经处理完毕的预警信息,设置相关的标志,标记为清除。  支持预警自动 清除 配置; 应能够通过组合不同的预警信息字段设置预警自动清除规则。  支持批量预警清除;  预警推送  支持自动推送配置,配置按照时间、维护管理人员等的推送策略;  可以根据告警数据的内容自由定义推送内容,并能手工编辑内容。  支持多种推送方式,包括短信、邮件等;  支持批量预警推送;  预警显示过滤 单位时间内发生的大量预警,能按定制的条目(可包含预警元素、预警级别、预警类别或预警节点等)进行过滤。 显示维护管理人 员、监控管理人员关心的预警信息, 从而减少轻微预警的干扰,以提高监控与处理的效率。  预警查询  提供定制化的预定义预警查询功能;  提供多种条件组合的预警查询; QBYXXXXXXX 19 质量管理 质量管理包括及时性管理、有效性管理 、责任人管理。 及时性 管理 提供告警生 成过程各环节时长计算、 异常提醒、数据展示 ; 告警有效性管理提供误告警管理,缺失告警管理; 责任人管理提供设定、 关联责任人功能。 及时性管理 【功能 定义 】 及时性 管理 是指被监控对象从 故障 发生到 告警生成过程 及时性的 量化 管理 , 通过对及时性管理 主动发现监控告警生成薄弱点, 促进 主动优化 监控维 护管理。 告警生成及时性主要通过告警生成时长来衡量, 根据主动 监控 、被动监控方式 , 告警生成时长 构成分为两种情况: 主动监控 方式是 指 根据采集周期主动从被管系统采集指标、故障告警信息实现监控 , 准确的告警生成时长 是 从 故障发生时间 到告警 生成 时间 的 总 时长 ,由于 故障发生时间大部分情况下无法采集到, 所以 告警生成时长也可以是从采集开始时间到告警生成时间的总时长。 被动监控 方式是指被管系统直接将故障告警信息传输给监控管理中心 实现监控,告警生成时长是故障发生时间到 告警生成的总时长。 及时性管理 包括 时长 计算 、 异常 提醒、 统计查询。 【 功能 要求 】  时长 计算 告 警 生 成 时 长故 障 发 生 t 1 告 警 生 成 p 4数 据 接 收 完 成 p 3采 集 结 束 p 2采 集 开 始 p 1告 警 生 成 p 6故 障 发 生 t 2 数 据 接 收 完 成 p 5采 集 时 长 传 输 时 长 数 据 处 理 时 长主动监控数 据 处 理 时 长告 警 生 成 时 长被动监控 图 23告警生成时长示意图 根据监控告警生成处理流程,告警生成时长可能存在采集、传输、数据处理三个主要环节。 由于各省监控系统架构实现差异性, 必须。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。