【运维小能手】网络故障的准确定位及处理
|
一、现象描述: 时间应该在一年前的一天,先后收到电信、部队通知,他们都有业务系统出现阻断(那是一条36芯光缆,前18芯是我们的,后18芯中16芯是电信,开的是集团业务,还有2芯是部队,整个光缆由我们负责维护), 告警信息:两家多个系统无光告警。 二、分析过程: 当时未收到网管监控的故障通知,马上电话询问网管监控,确定我们的三个干线系统均无故障。 1、 由此基本可以判断,故障点应该在电信和部队与我们线路分开后位置。 2、 又根据已掌握的资料,知道电信和部队光纤与分开的位置在进城高速匝道位置,该处与部队机房大约5公里。上面这一大段话直接反映到当时抢修时间不到5分钟(包括与网管电话)。 三、处理过程: 直接指挥维护一线兄弟赶赴该点(同时测试兄弟也直接赶往最近机房),不长时间,收到现场通知:一个工厂施工,破坏光缆线路。下面就简单了,现场与钩机,开挖作业面,接续,测试,完活。 四、感言: 1、自豪的是这个障碍分布在两个地区,要牵扯三个机房,若不熟悉网络情况,就需要通知两地兄弟,三处跑,那在路上浪费的时间可想而知,肯定要超时。虽然无我们的系统,但是那两家也会与我们算账的。 2、不管做什么工作,平时多积累技术资料,思考各网络中继段可能发生故障情形,及解决方案,是非常必要的。 |
| 这个好 |
当然有啦,活动主贴:http://support.huawei.com/huaweiconnect/thread-351521.html
有奖品没
楼主也来一个不?
Babala 发表于 2016-08-15 10:33 有个疑问,集团业务和部队是啥关系,为啥断了没告警呢?部队指的是啥呀嘿嘿。“又根据已掌握的资料,”这里 ... 这条缆是三家共用,由联通负责日常维护和障碍抢修。联通业务是省内干线环路,电信业务是集团干线业务,部队业务是到沈阳军区的。三部分各自有自己的网管系统,若同时告警,必定在合路部分;本次障碍只有电信和部队业务同时告警,我们未告警,就说明障碍点在电信和部队合路部分,又知两家纤芯与联通分开的位置据部队机房5公里左右,电信与部队分歧点位置在距部队机房500米位置。主要是平时注意重要线路的路由、距离、沿途经过的大的村庄、河流等数据积累,才能在出现故障时以比较快速度指挥抢修(不能说最快速度,谦虚一下),所以那次障碍在我这个环节用时短,实际上不敢说所有线路,全省大部分线路开放情况、经过那个机房、各处抢修半径、人员配置情况负责人电话,都在脑子里记着。 |
解释的很清楚呀:)我们对于光线路的诊断是否也会采用一些检测工具呀??
| 这就说明一个问题:对于我们的基础资料运维需求的是多么迫切,2013年我全省组织业务、光缆核查,省公司老大任组长(也就挂个名,但是可见有多么重视),结果又是无疾而终,为什么?难度一定会有,但是说到底就是现在运营商对运维的不重视,运维人换的象走马灯,你有再多好的想法,有再多的学习资料,基层维护人员的心根本不在这,你就是做什么都没有用。去年我主持开发了全专业资源动态管理系统,其中一部分就是把传输的线路板卡与光缆联系起来,让线维的资料纳入到资源管理系统中来,并在GIS系统中直观体现出来,这样楼主的问题就不是问题了,该项目去年我获得了创新奖,目前交给大唐正在开发。 |
把人的转化成流程和要求,人是不可控的,流程可控,给楼主个赞!!

Favorite (0)



这样我在所有社区的名字就统一了
老兄 换名称了吗?