论文部分内容阅读
摘 要:传输系统是通信网络的重要组成部分,它的优劣直接影响着通信网络的发展。如何在实践中根据设备网管告警及仪器仪表测试,在短时间内恢复故障处理是每一位运行维护人员应具备的基本业务素质。本文主要讲述理论传输故障处理的一般原则、定位和处理方法及案例分析。
关键词:告警;故障定位;故障处理
1 前言
光传输设备经过工程技术人员的精心安装、调测,都能正常安全稳定地运行,但有时由于多方面的原因,如受系统外部环境的影响、部分元器件的老化损坏、维护过程中的误操作等,都可能导致传输没备进入不正常运行状态。此时,如何维护好传输设备,迅速、准确的定位故障点及正确处理传输故障,是我们传输维护人员最关心的问题。
维护人员必须做好以下准备工作:
1.1掌握基本专业技能
?誗 熟练掌握SDH的基本原理。
?誗 熟练掌握光网络设备和网管的基本操作。
?誗 熟练掌握传输常用仪表的基本操作,光网络设备在维护中常用的仪表包括:2M误码仪、光功率计、SDH分析仪、万用表等。
1.2熟悉网络基本组网信息
?誗 熟悉网络组网情况。
?誗 熟悉网络业务配置。
?誗 熟悉设备运行状况。
1.3做好故障现场数据的采集与记录
在故障处理过程中,可将现场告警数据进行采集和保存,为快速定位设备故障提供支撑。故障结束时应将故障时间、现象、原因、分析处理过程及结果等详细信息做记录整理保存,为日后网络维护提供案例及经验。
2 故障定位方法
2.1故障定位关键
将故障准确定位到单站是故障定位的关键。光传输网络是由光传输设备以及它们之间的光纤组成,网络中绝大部分的故障是由于网络中某些网元或某段光纤的故障引起,因此如何将故障点定位到某一个特定区域的单个网元是故障定位的關键。
2.2故障定位原则
故障定位的一般原则是:“先外部,后传输;先网络,后网元;先高速,后低速;先高级,后低级”。
?誗 先定位外部,后定位传输:在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源等。
?誗 先定位网络,后定位网元:在定位故障时,首先要尽可能准确地定位出是哪个站的问题。
?誗 先排除高速部分,后排除低速部分:从告警的信号流中可以看出,高速信号的告警常常会引起低速信号的告警,因此在故障定位时,应先排除高速部分的故障。
?誗 先分析高级别告警,后分析低级别告警:在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。
2.3故障定位方法
2.3.1告警性能分析法
通过设备告警指示灯或网管获取告警信息和性能信息。SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。
2.3.2配置数据分析法
适用于故障定位到单站后故障的进一步分析,可以查清真正的故障原因,但故障定位时间相对较长。
2.3.3更改配置法
可以通过时隙配置、板位配置、单板参数配置等方法来判定故障定位到单站后,是否是由于配置错误导致的故障。
2.3.4环回法
环回法是SDH传输设备定位故障最常用、最行之有效的一种方法。通过“内环回/外环回、软件环回/硬件环回、线路环回/支路环回”来判定故障的具体位置。
2.3.5替换法
可以通过替换线缆、光纤、法兰盘、电源、单板等判断故障点。此法适用于排除传输外部设备的问题,也可将故障定位到单站或单板。
2.3.6仪表测试法
一般适用于排除设备外部问题及与其它设备的对接问题。常用的仪表有:光功率计、万用表、SDH误码分析仪等。
2.3.7经验处理法
通过以往工作经验,采用单板复位、单站重启、重新下发配置等方法也可有效地及时排除故障、恢复业务。
3 案例分析
3.1案例1
网络拓扑:网元NE1与NE2之间配置有E1业务,
现象描述:传输网管上报:网元NE1有MS_RDI、HP_RDI和LP_RDI告警;网元NE2有R_LOS、TU_AIS告警。
故障分析:由于R_LOS、MS_RDI和HP_RDI告警是属于线路告警,而LP_RDI、TU_AIS告警为支路告警。我们秉承“先排除高速部分,后排除低速部分”的原则,先分析线路的告警。因NE2有R_LOS,而NE1没有R_LOS,因此NE1产生相应的MS_RDI、HP_RDI告警。NE2的R_LOS告警导致产生TU_AIS告警,即NE1与NE2之间配置的E1业务不通。
故障定位:NE2的R_LOS告警为根源告警,说明NE1与NE2之间光路有故障,应是光纤单断。
故障处理:1、使用OTDR判定光纤故障点;
2、查看跳纤、光配法兰是否正常;
3、查看尾纤头是否脏了,引起衰耗过大;
4、更换本端或对端相应的光板。
经验总结:
如果相邻两网元本端有R-LOS告警,另一端有MS-RDI、HP_RDI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断,若另一端没有MS-RDI、MSREI告警,则说明光纤两根可能都中断了。
3.2案例2
网络拓扑:NE1有3块PQ1板分别与NE2、NE3、NE4都有E1业务,NE2、NE3、NE4之间没有业务。 现象描述:网管上报NE3有TU_AIS、NE1有LP_RDI告警。
故障分析:线路上无告警,支路上有TU_AIS、LP_RDI告警,通过分析告警和业务配置,可知告警影响的是 NE1与NE3之间的所有E1业务中断,其它业务正常。即NE1发给NE3方向的业务出现问题。
故障定位:故障点最有可能的是NE3的PQ1板故障或NE3与NE1
相对应的PQ1板故障。
故障处理:从NE1的故障通道中选取一个2M通道,将其从NE3的落地业务更改配置到NE2上落地。线路仍使用原来的VC4,如果NE2上报TU_AIS告警,则故障定位在NE1上,可能是NE1的PQ1板故障;如果NE2不上报TU_AIS告警,则故障定位在NE3上,可能是NE3的PQ1板故障。
经验总结:在使用更改时隙配置法时要求维护人员熟悉网管数据配置操作。当不能通过更改时隙配置法确定故障点时可通过“替换法”或“环回发”进行故障定位。
3.3案例3
网络拓扑:网元NE1与网元NE2之间配置有E1业务。
现象描述:网管上报网元NE1的第4个E1业务上报T_LOS告警,其他业务正常。
故障分析:NE1的T_LOS告警说明该端口未接收到2M信号。
故障定位:电源、2M线接反、单板或2M线缆故障。
故障处理:
1、判断是否由于该业务的终端设备停电而导致不能向传输设备发送2M信号。
2、是否由于现场有调试人员重新跳接2M跳线将2M接反,若有则将2M线收、发对调即可。
3、在网管操作,将NE1的第4个2M通道进行内环回,若T_LOS告警消失,则拆除内环回,在DDF侧继续判断;若T_LOS告警不消失,则说明是网元NE1的PQ1板有问题。
4、内环回拆除后,在网元NE1的DDF配线架上进行环回,若告警消失,则判定从DDF配线架到传输设备的通道正常,故障点可能在配线架至终端设备的跳线上,可检查2M跳线的端子头是否有脱落的现象或更换2M跳线。DDF配线架上进行环回,若告警不消失则判定故障点在设备至DDF架上的出线缆有问题或是接口板有故障,可采用替换法将第4个E1线缆进行替换,替换后告警消失,说明是设备出线电缆的故障,替换后若告警不消失,则说明是DDF架接口故障。
经验总结:此次故障定位秉承了“先外部,后传输”的原则。环回法操作简单,并能较快速地定位故障点,但网管操作的内环回只能判斷到传输设备的PQ1板。
4 结束语
在通信日益发展的今天,传输网络作为通信网络的基础网和支撑网,在通信网中的地位越来越重要。传输网络的稳定性将会直接影响到电力系统运行的质量,因此,传输维护工作显得非常重要。作为一名维护人员,必须提高自身素质,养成良好的工作作风和生活习惯,工作耐心细致、一丝不苟、沉着冷静、大胆果断,准确地分析业务走向,定位故障源头,从而快速排除故障,将对业务的影响减到最小。■
参考文献
《OSN光传输系统维护手册》 华为技术有限公司
作者简介:
沈晶(1977-),女,辽宁营口人,工程师。营口供电公司信息通信分公司 网络控制室 技术员。1997年毕业与吉林丰满电力工业学校,所学专业:发电厂及变电站电气设备运行。主要科技成果:《提高线路测试的准确度》科技进步三等奖、《中兴SDH光网络管理系统的优化》科技进步二等奖。
关键词:告警;故障定位;故障处理
1 前言
光传输设备经过工程技术人员的精心安装、调测,都能正常安全稳定地运行,但有时由于多方面的原因,如受系统外部环境的影响、部分元器件的老化损坏、维护过程中的误操作等,都可能导致传输没备进入不正常运行状态。此时,如何维护好传输设备,迅速、准确的定位故障点及正确处理传输故障,是我们传输维护人员最关心的问题。
维护人员必须做好以下准备工作:
1.1掌握基本专业技能
?誗 熟练掌握SDH的基本原理。
?誗 熟练掌握光网络设备和网管的基本操作。
?誗 熟练掌握传输常用仪表的基本操作,光网络设备在维护中常用的仪表包括:2M误码仪、光功率计、SDH分析仪、万用表等。
1.2熟悉网络基本组网信息
?誗 熟悉网络组网情况。
?誗 熟悉网络业务配置。
?誗 熟悉设备运行状况。
1.3做好故障现场数据的采集与记录
在故障处理过程中,可将现场告警数据进行采集和保存,为快速定位设备故障提供支撑。故障结束时应将故障时间、现象、原因、分析处理过程及结果等详细信息做记录整理保存,为日后网络维护提供案例及经验。
2 故障定位方法
2.1故障定位关键
将故障准确定位到单站是故障定位的关键。光传输网络是由光传输设备以及它们之间的光纤组成,网络中绝大部分的故障是由于网络中某些网元或某段光纤的故障引起,因此如何将故障点定位到某一个特定区域的单个网元是故障定位的關键。
2.2故障定位原则
故障定位的一般原则是:“先外部,后传输;先网络,后网元;先高速,后低速;先高级,后低级”。
?誗 先定位外部,后定位传输:在定位故障时,应先排除外部的可能因素,如光纤断,对接设备故障或电源等。
?誗 先定位网络,后定位网元:在定位故障时,首先要尽可能准确地定位出是哪个站的问题。
?誗 先排除高速部分,后排除低速部分:从告警的信号流中可以看出,高速信号的告警常常会引起低速信号的告警,因此在故障定位时,应先排除高速部分的故障。
?誗 先分析高级别告警,后分析低级别告警:在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别的告警,如次要告警和提示告警。
2.3故障定位方法
2.3.1告警性能分析法
通过设备告警指示灯或网管获取告警信息和性能信息。SDH信号的帧结构里定义了丰富的、包含系统告警和性能信息的开销字节。因此,当SDH系统发生故障时,一般会伴随有大量的告警和性能事件信息,通过对这些信息的分析,可大概判断出所发生故障的类型和位置。
2.3.2配置数据分析法
适用于故障定位到单站后故障的进一步分析,可以查清真正的故障原因,但故障定位时间相对较长。
2.3.3更改配置法
可以通过时隙配置、板位配置、单板参数配置等方法来判定故障定位到单站后,是否是由于配置错误导致的故障。
2.3.4环回法
环回法是SDH传输设备定位故障最常用、最行之有效的一种方法。通过“内环回/外环回、软件环回/硬件环回、线路环回/支路环回”来判定故障的具体位置。
2.3.5替换法
可以通过替换线缆、光纤、法兰盘、电源、单板等判断故障点。此法适用于排除传输外部设备的问题,也可将故障定位到单站或单板。
2.3.6仪表测试法
一般适用于排除设备外部问题及与其它设备的对接问题。常用的仪表有:光功率计、万用表、SDH误码分析仪等。
2.3.7经验处理法
通过以往工作经验,采用单板复位、单站重启、重新下发配置等方法也可有效地及时排除故障、恢复业务。
3 案例分析
3.1案例1
网络拓扑:网元NE1与NE2之间配置有E1业务,
现象描述:传输网管上报:网元NE1有MS_RDI、HP_RDI和LP_RDI告警;网元NE2有R_LOS、TU_AIS告警。
故障分析:由于R_LOS、MS_RDI和HP_RDI告警是属于线路告警,而LP_RDI、TU_AIS告警为支路告警。我们秉承“先排除高速部分,后排除低速部分”的原则,先分析线路的告警。因NE2有R_LOS,而NE1没有R_LOS,因此NE1产生相应的MS_RDI、HP_RDI告警。NE2的R_LOS告警导致产生TU_AIS告警,即NE1与NE2之间配置的E1业务不通。
故障定位:NE2的R_LOS告警为根源告警,说明NE1与NE2之间光路有故障,应是光纤单断。
故障处理:1、使用OTDR判定光纤故障点;
2、查看跳纤、光配法兰是否正常;
3、查看尾纤头是否脏了,引起衰耗过大;
4、更换本端或对端相应的光板。
经验总结:
如果相邻两网元本端有R-LOS告警,另一端有MS-RDI、HP_RDI,说明远端劣化指示和远端误码指示能够回传,可能是光纤单断,若另一端没有MS-RDI、MSREI告警,则说明光纤两根可能都中断了。
3.2案例2
网络拓扑:NE1有3块PQ1板分别与NE2、NE3、NE4都有E1业务,NE2、NE3、NE4之间没有业务。 现象描述:网管上报NE3有TU_AIS、NE1有LP_RDI告警。
故障分析:线路上无告警,支路上有TU_AIS、LP_RDI告警,通过分析告警和业务配置,可知告警影响的是 NE1与NE3之间的所有E1业务中断,其它业务正常。即NE1发给NE3方向的业务出现问题。
故障定位:故障点最有可能的是NE3的PQ1板故障或NE3与NE1
相对应的PQ1板故障。
故障处理:从NE1的故障通道中选取一个2M通道,将其从NE3的落地业务更改配置到NE2上落地。线路仍使用原来的VC4,如果NE2上报TU_AIS告警,则故障定位在NE1上,可能是NE1的PQ1板故障;如果NE2不上报TU_AIS告警,则故障定位在NE3上,可能是NE3的PQ1板故障。
经验总结:在使用更改时隙配置法时要求维护人员熟悉网管数据配置操作。当不能通过更改时隙配置法确定故障点时可通过“替换法”或“环回发”进行故障定位。
3.3案例3
网络拓扑:网元NE1与网元NE2之间配置有E1业务。
现象描述:网管上报网元NE1的第4个E1业务上报T_LOS告警,其他业务正常。
故障分析:NE1的T_LOS告警说明该端口未接收到2M信号。
故障定位:电源、2M线接反、单板或2M线缆故障。
故障处理:
1、判断是否由于该业务的终端设备停电而导致不能向传输设备发送2M信号。
2、是否由于现场有调试人员重新跳接2M跳线将2M接反,若有则将2M线收、发对调即可。
3、在网管操作,将NE1的第4个2M通道进行内环回,若T_LOS告警消失,则拆除内环回,在DDF侧继续判断;若T_LOS告警不消失,则说明是网元NE1的PQ1板有问题。
4、内环回拆除后,在网元NE1的DDF配线架上进行环回,若告警消失,则判定从DDF配线架到传输设备的通道正常,故障点可能在配线架至终端设备的跳线上,可检查2M跳线的端子头是否有脱落的现象或更换2M跳线。DDF配线架上进行环回,若告警不消失则判定故障点在设备至DDF架上的出线缆有问题或是接口板有故障,可采用替换法将第4个E1线缆进行替换,替换后告警消失,说明是设备出线电缆的故障,替换后若告警不消失,则说明是DDF架接口故障。
经验总结:此次故障定位秉承了“先外部,后传输”的原则。环回法操作简单,并能较快速地定位故障点,但网管操作的内环回只能判斷到传输设备的PQ1板。
4 结束语
在通信日益发展的今天,传输网络作为通信网络的基础网和支撑网,在通信网中的地位越来越重要。传输网络的稳定性将会直接影响到电力系统运行的质量,因此,传输维护工作显得非常重要。作为一名维护人员,必须提高自身素质,养成良好的工作作风和生活习惯,工作耐心细致、一丝不苟、沉着冷静、大胆果断,准确地分析业务走向,定位故障源头,从而快速排除故障,将对业务的影响减到最小。■
参考文献
《OSN光传输系统维护手册》 华为技术有限公司
作者简介:
沈晶(1977-),女,辽宁营口人,工程师。营口供电公司信息通信分公司 网络控制室 技术员。1997年毕业与吉林丰满电力工业学校,所学专业:发电厂及变电站电气设备运行。主要科技成果:《提高线路测试的准确度》科技进步三等奖、《中兴SDH光网络管理系统的优化》科技进步二等奖。