网管查看及告警问题处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17

网管问题介绍

网管服务及进程介绍
网管常见问题处理
告警性能问题处理
18
告警性能问题处理
由于IPRAN、POTS设备(以下简称新设备,其它设备简称老设备)的告警、 性能和网管之间使用的是PB数据协议,所以通过抓包已经不能只管的看 到设备上报了什么数据了,使大家碰到问题时不好确认是哪里的问题。 以向大家介绍不跟踪代码,初步排查问题的方法。 老设备使用MS0502、MS0702来和设备同步告警,其中MS0502是网管轮询 同步完整的告警数据,MS0702是设备主动上报增量告警数据。每30秒网 管会向设备发起一次MS0502轮询。新设备由于线路号扩展的原因,不再 使用这两个协议,但是同样有网管主动轮询和设备主动上报两种协议。 在两种情况下,网管会发起轮询: dtserver服务启动时,会向所有新设备的网元发起一次轮询; 新设备网元中断恢复时,网管会向该网元发起一次轮询。 请注意,这种轮询是一次性的,不会不停的轮询。 网管轮询告警使用的是JC0421协议。JC0421协议是一个协议族,里面分 了很多种子协议,告警轮询使用的是0D标志,简称JC0421-0D协议。 在轮询之后,设备发生告警变化时,通过JC0422-0D协议上报。
15
网管常见问题处理
Maneger2服务无法启动 检查网线是否插上,核查网关设置及otnm.ini中manager2中ip设置。 网管用户已锁定 1、多次输入密码错误后,网管用户被锁定,无法登入。一定时间过 后,又可以重新登入。 2、修改otnm.ini文件,查找PASSWORD_WRONG_LOCK_TIME 将其值修改 成 “0”,完成后重启Dtserver服务。 无法读取历史性能 1、是否有设置性能采集任务 2、是否只是某个时间点以前的可以读取,如果是,可以初步判定 数据库表问题,需要修复或清库。 无法读取历史告警 是否只是某个时间点以前的可以读取,如果是,可以初步判定为 据库表问题,需要修复或清库 告警或性能中有“noname”、设备告警不能屏蔽或环回 一般是单盘软件版本与网管软件版本不匹配导致,请抓包反馈回总 部等待补丁。
13
目Байду номын сангаас
网管问题介绍

网管服务及进程介绍
网管常见问题处理
告警性能问题处理
14
网管常见问题处理
无法打开OTNM2000界面 1、如果网管卡在正在检测数据处理服务,请重启dtserver服务。 2、如果网管卡在正在检测配置管理服务,请重启otnmcfgserver服务
网管在读取当前告警或当前性能时,一直停留在正在读取中 这种情况,网管在读取单盘状态等数据是正常,只是在读取告警和性能 时出现异常,无法读取是因为网管无法从数据库的当前告警表里获取数据。 Dtsever、DatabusServer、Queryserver、FILEServer、FTPServer其中 前三个服务与告警、性能查询均有关,最后两个服务与性能查询有关。 除ma和mb网元外,其余网元都不上网管 现场为2008server操作系统。 排查过程:抓包,显示并无什么不正常的数据。 问题分析:经分析为防火墙问题,关闭windows防火墙,网管恢复正常。
6
网管服务及进程介绍
EMS_OtnmApiServer 【主要功能】 用于给OTNM2100或者PTN运维工具等提供的网管接口函数的代理服务, 相对于Otnm2000网管软件系统来说它和Otnm2012.exe处于相同地位, 都属于客户端。 【可能导致的问题】 1、数据错误:2100及运维工具另有培训,此处不再赘述。 2、服务异常问题:服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION 及MDMP文件。 EMS_MSMPServer 【主要功能】 用于给标准Corba组提供的网管接口函数的代理服务,相对于Otnm2000 网管软件系统来说它和Otnm2012.exe处于相同地位,都属于客户端。 【可能导致的问题】 1、业务配置问题: 在多业务界面配置业务出现错误时网管一般均有相关提示,此处不再赘述。 2、服务异常问题: 服务异常时可在OTNM\UI\BIN目录下生成EXCEPTION及MDMP文件。
3
网管问题介绍
网管硬件问题: 网管软件的载体为服务器、硬盘等。对于此类硬件问题,第一要点 就是配置文件的备份及保护,这是恢复网管运行的首要条件。如果 日常维护的备份工作做的好,比如经常定期将配置文件做拷贝备份 的话就无此担忧了。
网管软件问题分类: 功能性问题:网管提供的基本功能,如告警、性能查询等 业务问题:和电路业务相关的问题 对于网管软件类问题,应重点关注操作方法,即问题是否能够通过 一定的操作步骤复现。
10
网管服务及进程介绍
EMS_Dtserver 【主要功能】在后台服务中,dtserver是所有服务的核心。dtserver的作 为核心服务,其流程可简单总结为:接收处理(包括二次处理)分发。从客 户端(包括UI,其它服务)接收命令,与设备无关的,进行相应处理之后, 直接应答;涉及到设备的命令,转发给manager2,收到manager2回应后, 再行应答。收到设备和manager2上报的数据,进行相应处理后,写入数据 库,上报给UI,并通过插件上报给外部程序(上层网管、corba接口)。 【可能导致的问题】 1、网管无法获取到告警、性能等信息 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_OtnmCfgServer 【主要功能】负责OTNM2000的配置管理。配置管理包括单盘配置、管理配置、 结构配置、集成配置功能、TOPO数据、域配置、端口配置、告警级别配置等。 【可能导致的问题】 1、各种配置方面的问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
16
网管常见问题处理
告警结束后未到24小时,没有人工手动确认,在当前告警库中无法查 到相应告警 检查d:\otnm\ui\ini\otnm.ini文件关于告警转储条件设置正确,自动 确认条件是AUTO_CHECK_ALARM_TIME= 1 day(一天自动确认), AUTO_CHECK_ALARM_NUMBER= 3000(已结束未确认告警超过3000条系统自动 确认)将结束未确认告警条目门限修改为10000条后,未再出现自动确认现象。 告警确认不仅只有一个时间参数,还有个条目数参数,目前默认设置 为3000( otnm.ini中的AUTO_CHECK_ALARM_NUMBER=3000),即在一天内如 果告警条目数超过3000条就会自动确认。 注意:修改参数后需重新启动dtserver设置才能生效。 网块中ma与mb的编号设置不正确导致manager2自动停止的 查看d:\otnm\ui\ini\otnm.ini文件中的manager2子项中的ip参数值与数据 库ip地址一致,没有发现异常,后经查看配置文件发现网块参数设置中Ma、 Mb出现如下错误:网块中有两个网元,其中网元编号分别为3和10,而在网 块设置中将ma和mb分别设置为1和2,即ma和mb的编号不是该网块中网元的编 号。修改正确后, manager2可以正常启动且不再停止。 网管无法处理网元编号不在本网块内的网元作为Ma/Mb,在网元 删除或网块调整时,请大家注意调整Ma/Mb的编号。
网管查看及告警问题处理
左冠琦

网管问题介绍

网管服务及进程介绍
网管常见问题处理
告警性能问题处理
2
网管问题介绍
什么是网管? 中文名称:网络管理 英文名称:Network Management 定义:监测、控制和记录网络资源的性能和使用情况,以使网络有效 运行,为用户提供一定质量水平的网络业务。网络管理包括对硬件、 软件和人力的使用、综合与协调,以便对网络资源进行监视、测试、 配置、分析、评价和控制。 什么样的问题属于网管问题? 作为我司产品的管理平台,几乎所有的问题,都会在网管界面予以 显示。究竟问题属于网管还是设备方面一般需要通过排查确认。我们 这里所说的网管常规故障,主要是指网管软件问题,对于网管硬件相 关的问题这里只做简要介绍。
12
网管服务及进程介绍
EMS_Manager2 【主要功能】 服务负责与设备通信,是dtserver与设备之间通信的协议适配层。除了 传递dtserver发送过来的命令之外,还负责性能采集、告警轮询、中断 判断、主备网元切换等工作。 【可能导致的问题】 1、数据获取问题(polling未注册等) 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_FileServer\EMS_FileZilla Server 【主要功能】 ftp服务,负责和设备之间以FTP的方式进行通信,目前主要有软件下载, IPRAN/POTS性能数据上传功能。 【可能导致的问题】 1、数据获取问题(polling未注册等) 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
4

网管问题介绍

网管服务及进程介绍
网管常见问题处理
告警性能问题处理
5
网管服务及进程介绍
目前应用的网管版本服务较老版本多了很多服务,每个服务都有其特定的 作用,当出现某网管问题时首先可逆向来判断是否网管相关服务存在问题。 Otnm2012 【主要功能】 otnm2000网管的界面主程序。 【可能导致的问题】 1、界面异常:界面异常时可在OTNM\UI\BIN目录下生成EXCEPTION及MDMP 文件,上报问题时说明操作步骤、附上相关问题即可。 2、界面显示问题:上报问题时需说明操作步骤及附上相关截图。 EMS_ArmyApi 【主要功能】 用于给标准Corba组提供的网管接口函数的代理服务,相对于Otnm2000网管 软件系统来说它和Otnm2012.exe处于相同地位,都属于客户端。 【可能导致的问题】 1、数据获取错误:接口问题另有培训,此处不再赘述。 2、服务异常问题:服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION 及MDMP文件。
8
网管服务及进程介绍
EMS_AuthUserRight 【主要功能】 鉴权服务,可以判断一个用户对一个资源(对象、命令等)的权限,用户 登录、配置改变等信息都要通过它进行计算。 【可能导致的问题】 1、用户登陆、设置等问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_PmDataGather 【主要功能】 提供秒级性能采集上报功能。 【可能导致的问题】 1、秒级性能采集问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
11
网管服务及进程介绍
EMS_Dumper 【主要功能】 Dumper服务是为了控制数据库的容量,在指定的条件下将数据库中的 数据转储为外部文件。 【可能导致的问题】 1、告警、性能等转储问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_OtnmSms_Agent 【主要功能】 它是一个短信服务。当发生用户关心的告警时,可以通过这个服务向用户 发送短信,使用告警远程通知功能时须启动。使用时需要配置otnm.ini中 相关参数,并在otnm2012.exe中选择需要上报的重要告警。 【可能导致的问题】 1、短信平台问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
7
网管服务及进程介绍
EMS_DispServer 【主要功能】 数据分发服务,负责对用户数据进行分权分域、告警灯计算、告警总数计算。 【可能导致的问题】 1、告警灯显示等问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_DataBusServer 【主要功能】 DP通信管理服务,有两个功能:接收DP槽位的管理;负责跨机通信。 【可能导致的问题】 1、客户端无法登陆服务器 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
9
网管服务及进程介绍
EMS_RsyncServer 【主要功能】 是一个跨平台的,高可配置性,部署简单,不依赖于互联网或者某种特定的 协议,而且可以自动运行的文件同步解决方案的服务。目前用于网管客户端 根据服务器的文件版本信息进行增量式升级。使用方法是在脚本里配置好需 要同步的目录,启动后就自动触发了,它和网管其他服务和进程无交互。 【可能导致的问题】 1、网管自动同步问题 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。 EMS_QueryServer 【主要功能】 查询服务,主要负责处理客户端发送的告警、性能、日志查询请求。 【可能导致的问题】 1、网管无法获取到告警、性能等信息 2、服务异常问题: 服务异常时可在OTNM\MD\BIN目录下生成EXCEPTION及MDMP文件。
相关文档
最新文档