【运维小能手】关于某包区FTTH用户故障处理分析的案例

会飞的熊
会飞的熊  Diamond  (1)
5 years 7 months ago  View: 9980  Reply: 25
1F

关于某包区FTTH用户故障处理分析的案例

 

一、 故障现象

4月21日上午维护11点左右人员接到包区师傅电话,其反应客户上报故障,FTTH用户无法正常登录,包区师傅现场多次更换光猫,光猫一直未能发现。

 

二、 故障处理过程

包区师傅电话机房,查询烽火A机房 OLT设备LIOD:5670134884 ONT,是否能自动发现,通过烽火网管查询,一直未发现该liod号光猫,为进一步确认值班人员通过网管菜单查看,未发现该光猫注册信息。

通过资源系统,查询该用户账号,发现该用户实为华为B机房 OLT承载,通过TCL控制台,登录查看,过程如下:

 

2.1定位设备PON口位置

display current-configuration

ont add 2 20 loid-auth "5670134884" always-on omci ont-lineprofile-id 27       

ont-srvprofile-id 0 desc "ONT_NO_DESCRIPTION"                                   

ont alarm-policy 2 20 policy-id 1                                              

cont bind-profile 2 20 1 profile-id 1    

结论:定位PON口位置: 0/6/2 ont 20

 

2.2查看光猫系统状态

display  board 0/6

  F/S/P   ONT         SN         Control     Run      Config   Match    Protect

          ID                     flag        state    state    state    side    

  -----------------------------------------------------------------------------

  0/ 6/2    0  4857544376AAE626  active      online   normal   match    no      

  0/ 6/2    1  46485454E7CD5B4A  active      offline  initial  initial  no      

  0/ 6/2    2  485754430B84A260  active      online   normal   match    no      

  0/ 6/2    3  46485454E7CD588E  active      offline  initial  initial  no      

  0/ 6/2    4  4857544376D42326  active      online   normal   match    no      

  0/ 6/2    6  4857544376DC4226  active      online   normal   match    no      

  0/ 6/2    7  4857544376D71726  active      online   normal   match    no      

  0/ 6/2    8  4857544376A9D826  active      online   normal   match    no      

  0/ 6/2    9  48575443766A1226  active      online   normal   match    no      

  0/ 6/2   10  4648545403E69C48  active      online   normal   match    no      

  0/ 6/2   11  4857544376AD3826  active      offline  initial  initial  no      

  0/ 6/2   12  485754431C98103B  active      offline  initial  initial  no      

  0/ 6/2   13  485754434586D606  active      offline  initial  initial  no      

  0/ 6/2   14  48575443D610550A  active      online   normal   match    no      

  0/ 6/2   15  4857544376D3E426  active      online   normal   match    no      

  0/ 6/2   16  4648545403E69AB8  active      online   normal   match    no      

  0/ 6/2   17  48575443C10D2241  active      offline  initial  initial  no      

  0/ 6/2   18  48575443C10F1A41  active      online   normal   match    no      

  0/ 6/2   19  4857544376D1DA26  active      online   normal   mismatch no      

  0/ 6/2   20  5A544547C0D7A69C  active      offline  initial  initial  no    

 

结论:系统显示目前状态为active、离线。

  通过display ont autofind all 未发现包区师傅所述光猫

 

分析:排除光猫、纤芯光路质量问题

综上该光猫无法正常上线,一直为离线状态,建议包区师傅更换光猫或者纤芯进行测试。

包区师傅更换光猫、纤芯测试(反馈现场光衰为-21DB左右),状态未变化,查看同一pon口 ONT ID相邻光衰信息,光猫接收光衰为:-19---23DB,且未达到门限值光衰,排除光猫、纤芯光路质量问题

 

 

2.3进一步定位光猫掉线历时记录

MA5680T(config-if-gpon-0/6)#display ont register-info 2 20        

 ------------------------------------------------------------------------------

  Index               : 10                                                      

  Auth-type           : loid-auth                                               

  SN                  : 5A544547C0D7A69C (ZTEG-C0D7A69C)                        

  Loid                : 5670134884                                              

  TYPE                : F601V6.0                                                

  UpTime              : 2016-04-20 11:11+08:00                               

  DownTime            : 2016-04-20 11:11+08:00                               

  DownCause           : ONT is deactivated                                      

 ------------------------------------------------------------------------------

  Index               : 9                                                       

  Auth-type           : loid-auth                                               

  SN                  : 5A544547C0D7A69C (ZTEG-C0D7A69C)                        

  Loid                : 5670134884                                              

  TYPE                : F601V6.0                                                

  UpTime              : 2016-04-20 11:11+08:00                               

  DownTime            : 2016-04-20 11:11+08:00                               

  DownCause           : ONT dying-gasp                                          

 ------------------------------------------------------------------------------

结论:系统显示最近一次掉线为ONT deactivated,即去激活导致掉线

 

分析:该结论同2.2存在矛盾 ,2.3显示掉线原因为设备去激活,但2.2显示结论为目前系统改光猫状态为激活

 

2.4查看环路监测记录

MA5680T(config)#display ring check record

  -------------------------------------------------                             

  Index     F /S /P     ONT  Remaining Time(min)                                

  -------------------------------------------------                             

      0     0 /6 /2      20                    -                                

  -------------------------------------------------                             

  Total num : 1  

结论:系统显示为环路去激活

 

分析:至此结合以上分析,得出结论为该光猫存在环路,系统自动去激活,导致无法正常上线,且2.1结论同2.2/2.3结论相矛盾。

 

三、 解决问题

进入端口,激活光猫:

MA5680T(config)#interface gpon 0/6                                                                                                              

MA5680T(config-if-gpon-0/6)#ont activate 2 20

    再次查看,状态正常(现场反馈正常)

MA5680T(config)#interface gpon 0/6

----------------------------------------------------------------------------  F/S/P   ONT         SN         Control     Run      Config   Match    Protect

          ID                     flag        state    state    state    side    

  -----------------------------------------------------------------------------

  0/ 6/2   17  48575443C10D2241  active      offline  initial  initial  no      

  0/ 6/2   18  48575443C10F1A41  active      online   normal   match    no      

  0/ 6/2   19  4857544376D1DA26  active      online   normal   mismatch no      

  0/ 6/2   20  5A544547C0D7A69C  active      online   normal   match    no      

----------------------------------------------------------------------------

 

 

 

四、 整体分析

1、 OLT环路原因:同一ONT同时上报2个相同的MAC地址或上报同OLT下其他ONT的MAC冲突。

2、处理故障需要通过多方面分析,日常处理习惯常用display board 指令,但该指令的结论,无法处理故障。通过检查光猫掉线历史记录及环路记录,综合判定为光猫环路,导致去激活。

3、关于不同指令之间矛盾问题:联系400客户热线,热线工程师反馈,因为该环路导致的去激活,在display board 指令里面,显示的光猫状态不正确,为系统bug


JackyLi
JackyLi  Senior 
5 years 7 months ago
2F
写的非常详细,学习了
Comment
会飞的熊 会飞的熊  5 years 7 months ago

菜鸟一个 不断学习 

Jh_guo
Jh_guo  Platinum 
5 years 7 months ago
3F
学习啦
Comment
会飞的熊 会飞的熊  5 years 7 months ago

版主好 我是小熊熊 还记得吗 

Babala
Babala  Moderator 
5 years 7 months ago
4F
环路问题,一步步深入分析,学习啦
嘟嘟飞
嘟嘟飞  Moderator 
5 years 7 months ago
5F
写的好详细,感谢分享
嘟嘟飞
嘟嘟飞  Moderator 
5 years 7 months ago
6F
就为这版面,就不得不~ 再来赞一个~
花儿喵喵
花儿喵喵  Junior 
5 years 7 months ago
7F
很细致!赞
魏曾妮
魏曾妮  Silver 
5 years 7 months ago
8F
好详细的分享,学习了
小小小飞鱼
小小小飞鱼  Platinum 
5 years 7 months ago
9F
楼主分享的这个案例很清晰,看完受益很大。
关于最后分析出的环路原因“OLT环路原因:同一ONT同时上报2个相同的MAC地址或上报同OLT下其他ONT的MAC冲突”,有点问题想请教一下,同一ONT为什么会同时上报2个相同的MAC地址呢?
Comment
梅山龙少 梅山龙少  5 years 6 months ago

应该是有移机激活释放不成功或者资源不对吧? 

tongtong1204
tongtong1204  Silver 
5 years 7 months ago
10F
好详细的分享呀,顶一个
1/3Page