【运维小能手】某某ITV多例用户直播卡顿故障

[复制链接]
嘟嘟飞   版主    发表于 2016-8-25 20:31:33   最新回复:2016-08-25 23:25:26

某某ITV多例用户直播卡顿故障

【案例摘要】

2016X22日,某某陆续接到即墨区、城阳区、市南区报ITV直播卡顿,开发区ITV换台卡顿。经排查为某某世纪大厦CR至新大楼IPTV 9306单通,IPTV 9306 端口DOWN,经波分板卡端口模式更改导致。本地及省公司处理后恢复。

1、问题描述

即墨城阳区域报障共20例用户,市南区银座嘉泽酒店共90例用户ITV直播卡顿,开发区报障共10例用户ITV换台卡顿。其他区域无反应。故障现象宽带测速均正常。机顶盒均为有线连接,恢复出厂设置后无效。其中城阳营业厅更换机顶盒后正常。

2、原因分析

2.1问题查询:

1X22日上午,数据专业首先接到即墨城阳两区域报障,数据人员在新大楼机房测试ITV直播正常。确认即墨、城阳城域网设备、OLT近期未做过扩容割接等操作。查看即墨、城阳BAS及下挂OLT流量无拥塞。

联系省ITV支撑人员其他地市无类似故障现象,查看平台在线用户数5台服务器分配均匀。因德州枣庄某某共用CDN平台,联系德州枣庄称并未收到类似故障。根据报障范围10例用户,建议针对两个区域网络设备进行排查。

2X22日下午,数据专业收到市南区银座嘉泽酒店90ITV账号,ITV直播卡顿持续2-3天。数据专业查看接入ONU链路正常,PING上行大包无丢包。

联系省NOC查看ITV账号在不同时段确实有质量差记录,建议收集机顶盒型号,同时,城阳营业厅测试,海信IP906H换成IP5086H好用,但在机房机房测试两款机顶盒直播都正常。联系海信厂家称近期没有做过操作。

3)因ITV相关近期做过组播部署以及机顶盒软探针部署。未部署组播OLT也发生同样故障,排除组播业务部署导致;经和省终端人员联系称海信IP906H并没有做过升级,排除机顶盒软探针部署导致。

2.2问题定位:

X22日晚省NOC查看IPTV 9306_2一条链路流量有问题,某某查看世纪大厦CR GE2/5/0/1IPTV 9306_2 GE5/0/1端口,UP但无流量。省NOC查看IPTV 9306_2 GE5/0/1端口X20日下午14:06DOWN,电路单通状态。某某数据专业将世纪大厦CR GE2/5/0/1 shutdown ,报障各区域称用户故障恢复。

2.3问题分析:

某某共有两台IPTV9306设备。分别以3*10GE连接至某某两台CR设备。不分主备,共同分担ITV用户业务流量。

     总结分析如下:

(1)枣庄和德州好用,某某不好用

枣庄和德州ITV业务路由:某某CDN-某某ITV9306-某某国干D链路,无问题。

某某ITV业务路由:某某CDN-某某ITV9306-某某CR链路,有问题。

(2)某某部分ITV用户好用,部分不好用

   某某IPTV 9306至某某CR6条链路,走到单通链路的部分ITV用户业务不好用。

(3)报障用户中,城阳营业厅用户换机顶盒后好用

   更换或重启机顶盒后,部分用户会重新选择路由,走到正常链路上ITV业务会恢复。

2.4问题解决

某某数据、传输专业及省NOC共同处理后,经查为IPTV9306_2至世纪大厦CR所经波分侧端口模式变更,导致端口9036端口DOWN,修改后恢复。

3、经验总结

通过此次故障,使某某维护人员对本地ITV网络有了进一步了解。导致本次故障发生的主要原因是链路单通,但深层分析原因,能看出维护人员日常维护发现隐患不足。

(1)因为故障区域分布在即墨、城阳、开发区、城阳,未接到其他区域报障,受区域及报障用户数比例影响,未能及时检查ITV相关电路状态查到原因。城阳营业厅更换机顶盒后故障恢复,将故障定位至机顶盒,处理方向有误,导致故障历时久。

(2)遇此类ITV多用户共性故障,数据人员收到故障后,应第一时间查看IP综合网管及CR设备流量情况。

    (3)单通电路并不进行派单,CR侧端口UP,所以某某未收到派单。建议在端口起BFD协议,能够避免单通导致业务故障。

(4)传输波分端口DOWN,未收到派单及告警。

(5)本地数据专业需每日负责查看ITV平台流量报表。

 

社区互动你我他,繁荣和谐靠大家
跳转到指定楼层
朝阳区群众
朝阳区群众   小试牛刀    发表于 2016-8-25 23:23:54

IPTV的直播3.6.5。8的问题一直还未解决
朝阳区群众
朝阳区群众   小试牛刀    发表于 2016-8-25 23:25:26

IPTV的直播3.6.5。8的问题一直还未解决
快速回复 返回顶部