【存储赋能方案】存储系统巡检结果分析及常见问题处理
|
说明:带有“*”符号的资源,表示需要账号权限登录获取。 第一部分 存储系统巡检结果分析及常见问题处理课程内容
【课程内容】: 1、存储系统巡检结果分析。 2、常见问题处理。 【培训老师】:王维 文思惟 【培训时间】:2013-10-18/24 19:00 -- 20:30 【培训地点】:华为成研所 U8-3-B08 《T系列&Sx900存储产品巡检指导及常见问题处理》下载地址:*LINK
《T系列存储赋能方案》下载地址:LINK 第二部分 培训课堂问题解答
以下帖子&文档来源于2013年10月17日和24日400&国内GTAC培训《存储系统巡检结果分析及常见问题处理课程》课堂问题。 问题1: ses 异常复位,如何查看是系统重启导致? 答案:通过查看运行日志确认。 对于S2300和S5000R1、R2是查看runlog运行日志,搜索关键字“system is in”可以确认重启时间。 对于R5版本查看event文件,搜索关键字“Both controllers of the system are working”(适用于双控)或者“the system is working”(适用于单控),确定重启时间。
问题2:MD5校验,是否可以让工具去修改? 答案:工具目前只做巡检,不做修正,如果有需求,可单独向工具组提or需求单。
问题3:如果存储系统创建了扩展LUN,巡检工具会不会报错? 答案:扩展LUN的从LUN因没有自身的运行控制器和运行策略,巡检工具会报错,该问题会向工具组提单修改,增加对私有LUN的判断。
问题4:心跳IP和业务IP一个网段,会导致什么问题? 答案:有可能业务的数据包被TCP/IP协议栈转给心跳网卡处理,结果心跳网卡把数据包直接丢掉,导致业务口网络不稳定,出现丢包。
问题5:最新的巡检工具,LUN强制回写会不会报错? 答案:LUN正常情况下是回写镜像,如果修改为强制回写一般有特殊原因,属于非正常状态, 应该报错,需和客户确认。
问题6:大小版本自检如何对应? 答案:请参见附件《老产品阵列产品各发布版本的配套关系表》 。
问题7:什么情况下会上报FC链路误码过多? 答案: FC端口只能检测收到的误码,每收到一个误码计数+1。误码告警的策略是2秒例测1次,共例测3次,每次都有误码增加,就会发误码过多的告警。
问题8:什么情况下会上报交换机到主机链路异常?
答案:FC驱动通过对FC端口收到的RSCN来判断主机到交换机连通性是否正确,每两分钟为一个检测周期,如果5个周期阵列的同一个FC口都有RSCN的增加,则发该告警。如果5个周期内都没有RSCN增加,则消除。
问题9:巡检不通过自动收集日志的建议是什么?
答案: 巡检不通过是能够会自动提示收集日志的,如果选择确定,将自动跳转到日志收集界面。
问题10:升级检查工具和巡检工具归一可行性?
目前T系列是没有单独的升级检查工具的,T系列的ISM servicetool 已经包括了升级前检查的功能;老产品有升级检查工具,但是出于安全原因,无法集成到ISM servicetool中。
第三部分 存储系统巡检结果分析及常见问题处理相关知识资源
第四部分 培训现场
华为存储产品信息自助服务平台:Link 华为存储产品多媒体专区(优酷):Link |