网络故障排查指南:从ping不通到丢包问题的全面解析
网络故障排查指南:从ping不通到丢包问题的全面解析
本文将详细介绍网络故障排查的实用方法,包括无法通过Xshell等客户端登录Linux系统的问题、网络ping不通的各种原因分析以及网络丢包的处理方法。文章内容专业且实用,适合IT运维人员和网络管理员阅读。
问题描述
虚拟机IP地址配置好了,虚拟机可以ping通外网,电脑也可以ping通虚拟机ip,但xshell等客户端无法通过IP地址链接linux。
分析与解决方法
基本检查
- 检查Windows的防火墙是否关闭
- 检查本机的默认网关是否填写正确
- 若没有填写本机的网关,想连着内网又同时可以上着无线的外网,需要使用route add命令添加你要ping的主机ip路由。
具体操作步骤
将网络连接里面所有的vmware开头的,先禁用,再启动(再使用xshell等客户端,去连接linux系统终端。)(有效果)
网络ping不通的原因分析
同网段ping不通
- 结果是“无法访问目标主机”
- 对方是否开机?ip是否存在?
- 有跨交换机vlan的话,检查对应的中间trunk链路是否导通?
- 走直连路由是否正确?是否应该走默认路由,而走了直连路由。
- 子网掩码是否错误。
- 默认网关是否填写正确
- 结果是“超时(time out)”
- 检查下防火墙,防火墙禁止了对ping的回应。
- 子网掩码的设置错误,导致不在同一个网段。
- 设备硬件故障,导致设备没有对应的mac地址,无法生成路由表,而走默认路由。
- ip冲突,或ip地址与直联路由不在同一个网段。
- 网关没有设置好
跨网段ping不通
- 结果是“无法访问目标主机”
- 目的ip地址不存在
- 检查路由表是否有缺省的路由
- 检查arp表是否有网关的mac地址
- 有网关设置错误
- 走了默认路由
- 结果是“time out”
- 检查下防火墙,是否拦截了ping的请求消息。
- 检查经过节点的路由是否正确,或者是否有回程路由。
- 回程路由的硬件网卡出口和ping的request的入口网卡不是同一个
- 交换机vlan对应的接口全部down了,导致vlan状态down,vlan的对应路由没有生成。
网络丢包的处理方法
使用MTR命令查看丢包率
在Linux中使用MTR命令查看机器丢包率:
mtr ip
测试是否丢包
可以使用命令:
ping -t 192.168.16.1
或
ping 192.168.16.1
常见网络故障处理
一、网络数据包发送时通时断
故障现象:
通常故障发生时,该方向网络出现震荡性中断。使用Ping命令测试,发现在一段时间内数据包发送延时比正常值略高,间隔一小段时间数据包又全部丢失,丢包率超过50%,丢包曲线成规则状,网络服务基本不可用。
故障分析:
在局域网中引起网络发生振荡性时断时通,一般可能是由于互连的交换机中的某两个交换机间出现了环路,或者某个交换机的两个端口直接相连。这样就会造成局域网的生成树协议构建失败,不断重复检查并试图构建新的生成树网络,从而导致网络振荡性通断,同时伴随着交换机间不断重复地发送广播包,就会形成“广播风暴”,使交换机负担过重,网络传输通道严重被堵塞,无法正常的处理通信数据。环路虽然可能出现在某个接入交换机上,但会影响整个以三层交换机为核心的局域网的稳定运行。
故障处理:
当发现网络数据包发送时通时断,丢包严重,特别是整个单位或整个楼层出现振荡性中断现象时,则可以判定应该是该单位的某个交换机上出现了环路所致。作为网络管理人员应首先查看各接入交换机的指示灯闪烁状态,通常出现环路状况会指示灯会急速闪烁,次数每秒4次以上,相连的交换机更为突出。逐个拨出交换机级联接入网线,同时实时监控交换机状态,在拨下某端口网线后,交换机指示灯恢复正常状态,再进一步查找,会发现该连接线的末端有线路形成环路,清理该网线后,网络恢复畅通。
二、数据发送超时现象严重
故障现象:
ping的时候返回时间比较长,网络突然出现严重堵塞,打开网页速度缓慢,有时会因超时而中断。未发现网络设备有任何问题,该网络中有几台计算机速度明显变慢或者掉线,在禁用网卡或者中断网络后恢复正常。
故障分析:
首先,在一台用户终端上ping网关测试,结果可以ping通网关,但是数据包发送超时现象严重,丢包率30%左右,丢包不规律。其次,登陆用户交换机,运行arp -a命令,发现网关IP和网关MAC地址指向正确。通过上面的测试基本排除网络设置错误以及ARP欺骗,先看带宽,如果带宽充足,仍然有丢包的情况,这个问题可能是路由器/交换机/防火墙无法处理大流量,你已经达到了你硬件所能提供的最大的流量了。
故障处理:
这个一般是设备性能在该项目中没有选用正确,达到了上限了,主要是路由器、交换机在当下的网络中选用不合适,或者网线距离过长等问题,升级相应的设备,或减少项目中的接入量可以找到原因。
三、数据包发送有严重延时
故障现象:
在一个大的网络中,大部分使用正常,只有一部分网络存在延时,使用Ping命令发现到某个方向网络时延特别大,甚至有少量丢包现象。
故障分析:
一般远程登陆到该方向的交换机,以华为系列交换机为例,输入下列命令:
Display cpu-usage
查看交换机CPU利用率
Display memory
查看内存利用率
若发现两者都非常高,再通过输入命令
Display interface端口号
可以不断的检查各端口下的数据流。(ctrl+c终止)。若发现其中的两个端口数据流量特别大,远高于正常使用的网络流量。对其数据流进行抓包分析,为避免影响整个网络的畅通,对所接入交换机进行处理。
故障处理:
进入该端口配置界面下,输入Shutdown命令,强制关闭该端口使其断网,联系该终端使用人员,令其终止下载进程后,再恢复其网络。
参考链接
- http://www.360doc.com/content/17/1112/23/34721531_703283359.shtml
- https://blog.csdn.net/Hi_alan/article/details/85807088?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1
- https://blog.csdn.net/qq_40907977/article/details/104020574
- 网络 ping 不通是什么原因? :https://mp.weixin.qq.com/s/uqxkHcH1ruEpcHDV0TCv2Q
- 网络丢包怎么办?这些解决办法不得不知 : https://mp.weixin.qq.com/s/RfUF8-4rf2Wf6tdKZgrbVA