案例分析题 阅读下列说明,回答问题1至问题2,将解答填入对应栏内。

【说明】

某云服务公司在A市开展云服务业务近1年。近期由于业务持续增长,原有资源利用率居高不下,而且连续出现几次网络故障,客户抱怨不断。

公司安排小张到现场解决以上运维问题。经过沟通,小张有如下收获:

(1)现场缺少必要的运维工具,目前使用ping、tracert等命令行方式管理网络。

(2)现场运维人员能力和经验不足,不能主动发现故障,故障诊断不准,排除顺序不合理,处理时间长。(3)资源紧张,但应该有较大优化空间,暂时无须额外采购。

基于了解到的情况,小张进行了必要的整改工作。

【问题1】

请将卜面(1) ~(3)处的答案填写在对应栏内。

由于当前维护手段无法及时获取资源的使用情况,出现故障后也无法及时定位,小张建议运维工具应该优先满足(1)和(2)的需要。

为了迅速提高网络故障的处理能力,针对网络设施的监控,小张要求工具必须能够做到网络拓扑监控、网络设备监控、(3)和网络设备端口监控。

【问题2】

客户又有故障上报,说业务网站无法打开。小张首先安排网络工程师做诊断,然后又安排系统工程师以及业务系统服务团队配合。

(1)请说明为什么需要系统工程师和业务系统服务团队的配合。

(2)给出网络工程师故障诊断可能使用的方法,并指出该方法可以诊断哪些问题。

【正确答案】【问题1】

目前只能使用ping等方式,说明没有任何自动化的工具支持,而且被动发现故障,说明没有监控系统;判断故障也不准,说明没有辅助手段,至少没有日志分析的工具。因此相对自动部署、高效配置等工具,监控和日志工具更急需。

(1)运维监控;

(2)日志分析;

(3)网络链路监控。

【问题2】

(1)因为网站不能访问,也有可能是系统或者应用的问题,让其他团队配合是为了提高故障排除的效率。其他团队的人员支持可以弥补网络工程的能力不足,提升发现故障的效率。

(2)排除法:网站问题、链路问题、客户终端问题、浏览器问题等。

对比法:访问其他网站、使用其他设备访问等。替换法:使用ping等。

【答案解析】问题1联系题干考核的是运维工具,在题干表明其他工具缺失的情况下,首先应补齐监控工具和日志工具,来帮助分析。第三空考核的例行操作运维中网络设施监控的内容,主要包括网络拓扑监控、网络设备监控、网络链路监控、网络设备端口监控。

问题2则要联系题干思考是哪些方面出的问题,因为网站不能访问,也有可能是系统或者应用的问题,让其他团队配合是为了提高故障排除的效率。其他团队的人员支持可以弥补网络工程师的能力不足,提升发现故障的效率。而方法,则有以下方法,能排查出相应问题:

排除法:网站问题、链路问题、客户终端问题、浏览器问题等。

对比法:访问其他网站、使用其他设备访问等。

替换法:使用ping等。