【运维小能手】网络故障的准确定位及处理

[复制链接]
奕心
奕心   版主    发表于 2016-8-13 00:04:07   最新回复:2016-09-29 21:04:31

一、现象描述:

时间应该在一年前的一天,先后收到电信、部队通知,他们都有业务系统出现阻断(那是一条36芯光缆,前18芯是我们的,后18芯中16芯是电信,开的是集团业务,还有2芯是部队,整个光缆由我们负责维护),

告警信息:两家多个系统无光告警。

二、分析过程:

当时未收到网管监控的故障通知,马上电话询问网管监控,确定我们的三个干线系统均无故障。

1、  由此基本可以判断,故障点应该在电信和部队与我们线路分开后位置。

2、  又根据已掌握的资料,知道电信和部队光纤与分开的位置在进城高速匝道位置,该处与部队机房大约5公里。上面这一大段话直接反映到当时抢修时间不到5分钟(包括与网管电话)。

三、处理过程:

直接指挥维护一线兄弟赶赴该点(同时测试兄弟也直接赶往最近机房),不长时间,收到现场通知:一个工厂施工,破坏光缆线路。下面就简单了,现场与钩机,开挖作业面,接续,测试,完活。

四、感言:

1、自豪的是这个障碍分布在两个地区,要牵扯三个机房,若不熟悉网络情况,就需要通知两地兄弟,三处跑,那在路上浪费的时间可想而知,肯定要超时。虽然无我们的系统,但是那两家也会与我们算账的。

2、不管做什么工作,平时多积累技术资料,思考各网络中继段可能发生故障情形,及解决方案,是非常必要的。

奕心
奕心 发表于 2016-8-19 01:55
这样我在所有社区的名字就统一了 
会飞的熊
会飞的熊 发表于 2016-8-18 18:25
老兄 换名称了吗? 
跳转到指定楼层
Ken_liu
Ken_liu   金牌会员    发表于 2016-8-13 16:24:34

处理故障效率太高了
奕心
奕心 发表于 2016-8-13 16:50
我年轻时可以在家遥控处理所有设备和系统障碍,说出故障现象或告警信息,直接指挥现场人员处理障碍。打牌时从第一张到最后,直接记住顺序。 
Babala
Babala   版主    发表于 2016-8-15 10:33:04

有个疑问,集团业务和部队是啥关系,为啥断了没告警呢?部队指的是啥呀嘿嘿。“又根据已掌握的资料,”这里能不能具体说下怎么分析的呀?我觉得这块是关键啦
dhthongbin
dhthongbin   版主    发表于 2016-8-15 10:53:19

这个好
Babala
Babala 发表于 2016-8-18 16:49
当然有啦,活动主贴:http://support.huawei.com/huaweiconnect/thread-351521.html 
dhthongbin
dhthongbin 发表于 2016-8-16 11:52
有奖品没 
Babala
Babala 发表于 2016-8-16 11:43
楼主也来一个不? 
o0436o_guo
o0436o_guo   白金会员    发表于 2016-8-15 10:56:45

这就相当于干线光缆里分出一些纤芯,给本地网使用一样,干线中继段往往80公里左右,故障定位不准确,如果干线纤芯中分给本地网使用,每个15公里引下至基站、模块局,但发生光缆中断时,通过本地网传输能将故障范围缩小至15公里以内。
Babala
Babala 发表于 2016-8-16 11:43
点评到位,点个大大赞! 
白城你郭哥
小小小飞鱼
小小小飞鱼   白金会员    发表于 2016-8-15 15:05:56

从楼主的描述来看,对网络是非常熟悉,故障点的判断也是很快的,赞一个!希望分享更多的经验
奕心
奕心   版主    发表于 2016-8-15 18:25:07

Babala 发表于 2016-08-15 10:33 有个疑问,集团业务和部队是啥关系,为啥断了没告警呢?部队指的是啥呀嘿嘿。“又根据已掌握的资料,”这里 ...
@Babala,关于你的疑问,补充如下:
这条缆是三家共用,由联通负责日常维护和障碍抢修。联通业务是省内干线环路,电信业务是集团干线业务,部队业务是到沈阳军区的。三部分各自有自己的网管系统,若同时告警,必定在合路部分;本次障碍只有电信和部队业务同时告警,我们未告警,就说明障碍点在电信和部队合路部分,又知两家纤芯与联通分开的位置据部队机房5公里左右,电信与部队分歧点位置在距部队机房500米位置。主要是平时注意重要线路的路由、距离、沿途经过的大的村庄、河流等数据积累,才能在出现故障时以比较快速度指挥抢修(不能说最快速度,谦虚一下),所以那次障碍在我这个环节用时短,实际上不敢说所有线路,全省大部分线路开放情况、经过那个机房、各处抢修半径、人员配置情况负责人电话,都在脑子里记着。
Babala
Babala 发表于 2016-8-16 09:14
解释的很清楚呀:)我们对于光线路的诊断是否也会采用一些检测工具呀?? 
奕心
奕心   版主    发表于 2016-8-16 10:14:17

测试工具现有的是红外光源、光功率计可以粗略地查看线路整体衰耗情况;OTDR准确测试整个线路各点衰耗情况,对于单点有0.5dB以上衰耗要求处理,OTDR有200米盲区。
Babala
Babala 发表于 2016-8-16 10:55
感谢,只想说楼主有干货,欢迎继续分享哦:) 
奕心
奕心   版主    发表于 2016-8-16 11:19:37

我们在一些实际工作中经验可能多一些,但从你们那里学到的新知识、新设备、新技术更多。这不算互相吹捧吧,哈。
Babala
Babala 发表于 2016-8-16 11:42
哈哈,小女子我就不客气笑纳啦:)去现场的机会不多,这块故障内容之前我也写过,现在通过GG的案例又加深理解了:) 
wanghui63
wanghui63   版主    发表于 2016-8-17 11:11:41

这就说明一个问题:对于我们的基础资料运维需求的是多么迫切,2013年我全省组织业务、光缆核查,省公司老大任组长(也就挂个名,但是可见有多么重视),结果又是无疾而终,为什么?难度一定会有,但是说到底就是现在运营商对运维的不重视,运维人换的象走马灯,你有再多好的想法,有再多的学习资料,基层维护人员的心根本不在这,你就是做什么都没有用。去年我主持开发了全专业资源动态管理系统,其中一部分就是把传输的线路板卡与光缆联系起来,让线维的资料纳入到资源管理系统中来,并在GIS系统中直观体现出来,这样楼主的问题就不是问题了,该项目去年我获得了创新奖,目前交给大唐正在开发。
Babala
Babala 发表于 2016-8-17 12:04
把人的转化成流程和要求,人是不可控的,流程可控,给楼主个赞!! 
抓紧一切时间学习,学习的时候是最快乐的时候,感恩社区!至于其他,淡定吧
12
返回列表
快速回复 返回顶部