简介:电脑上不了网的原因有很多,主要靠有经验的网管一个个查。本文分享一个电脑上不了网的解决案例。排除故障的过程比较曲折,用了很多方法都无济于事。最后查明故障原因是交换机设置不正确导致端口短路。希望对遇到同样问题的人有所帮助。
故障现象
一个单位局域网规模适中,普通客户端100个左右,分布在四层。每个楼层的所有客户系统通过super-5网络电缆连接到H3C S3050楼层交换机,每个楼层交换机通过1000M光缆连接到单元局域网的核心交换机。整个局域网通过硬件防火墙与外网相连,所有客户端系统都可以正常访问外网。为了保证局域网的运行安全,网管特意把每层楼的电脑划分到同一个虚拟工作子网,虚拟工作子网之间不能互相访问。最近不知道为什么,局域网内的一些客户端系统突然出现上网异常,具体现象是上网速度很慢,经常出现一会儿能上网一会儿不能上网的奇怪故障;网管现场调查后发现,几乎所有上网异常的客户端系统都位于同一楼层,而其他楼层的普通客户端系统都可以正常上网。
故障排除流程
1.检查物理连接。
由于故障现象只限于同一楼层,且这种现象与网络接触不良非常相似,网管下意识地认为相应楼层的交换机与局域网内的核心交换机之间可能存在物理连接不可靠的现象。于是,网管立即拔掉故障交换机与核心交换机之间的网线,用专业的线缆测试仪测试线缆的连通性,发现物理线缆没有问题,然后将网线两端重新插入交换机端口,并确保水晶头与交换机端口接触牢固。然而,当网络管理人员尝试在任何客户端系统中使用ping命令测试局域网网关地址时,发现测试效果仍然不稳定,数据包丢失严重。显然,物理连接不是故障的原因。
2.检查ARP病毒
考虑到客户端系统使用的IP地址和楼层交换机使用的IP地址位于同一个工作网段,且近期ARP病毒非常流行,网管开始怀疑对应楼层的工作子网中存在ARP病毒;由于故障计算机所在的工作子网包含数十台互联网主机,因此如何快速确定ARP病毒源的位置,将感染病毒的客户端系统与虚拟工作子网隔离开来,保证其他客户端系统安全稳定上网,是网络管理的当务之急。
虽然手头没有ARP病毒监控工具,但是网管查了局域网的拓扑数据后发现每个楼层交换机都支持网管。同时他们开启了日志记忆功能,可以跟踪记录交换机下ARP病毒导致的地址冲突。基于此,网管准备登录故障交换机的后台系统,查看系统的日志记录,看是否有相关的地址冲突信息;就是这样。网管立即通过控制台控制端口登录故障交换机的后台管理系统,在系统的全局配置模式下执行“display logbuf”命令。从弹出的结果界面来看,网管没有发现任何ARP病毒导致的地址冲突记录,说明对应的虚拟工作子网没有ARP病毒。
3.检查广播风暴
由于故障子网中没有ARP病毒,且楼层交换机与核心交换机之间的物理连接正常,因此局域网中可能存在广播风暴现象,导致网络传输通道阻塞。导致故障子网的客户端系统上网时,会出现网速慢,或者一会儿能上网,一会儿不能上网的奇怪故障。为确认对应的虚拟工作子网是否存在广播风暴现象,网管进入局域网核心交换机的后台系统,使用接口命令进入故障楼层交换机和核心交换机的级联端口,执行“显示接口xxx”命令检查指定级联端口的工作状态;结果发现级联端口的工作状态有时是‘上’,有时是‘下’。更奇怪的是,这个级联端口的输入输出包大小明显异常,数据流量比平时大十几倍。为什么故障子网的数据流量突然变得这么大?对应的虚拟工作子网是否存在恶意BT下载?但是,当网管反复执行‘显示接口XXX’命令时,发现该端口的广播包流量不断增加。很明显,这个端口下面的虚拟工作子网存在广播风暴现象。
4.检查端口回路。
在弄清楚故障虚拟工作子网中的广播风暴现象后,接下来的工作是找出导致广播风暴现象的具体“罪魁祸首”。考虑到造成广播风暴现象的因素很多,如网络设备损坏、网络连接成环、网络病毒等。但最常见的因素往往是用户的粗心操作,无意中在虚拟工作子网中形成网络环路。
考虑到局域网内所有交换机都开启了网络环路测试功能,为了消除网络环路因素,网管立即进入故障楼层交换机的后台系统,在系统命令行状态下执行‘display logbuf’命令,查看交换机的日志记录。发现日志记录明确显示8号交换机端口存在网络环路现象。到达故障交换机现场时,网管发现8号交换机端口信号灯亮着,表示该端口正在工作。当试图拔出连接到交换机端口的网络电缆时,网络管理员感到非常惊讶。网络连接断开时,交换机端口仍在闪烁。发生了什么事?交换机端口是否被硬件损坏?
问题解答
由于交换机端口存在网络环路,网络管理员决定先关闭交换机端口,看看相应交换机的工作子网状态是否恢复正常。说到做到,网管立即登录故障交换机的后台系统,执行‘interface e0/8’命令,进入e0/8交换机端口的查看模式状态,并在此状态下继续执行字符串命令‘shut down’,关闭E0/8交换机端口的工作状态。
之后,网络管理试图在故障客户机系统上执行ping命令,并测试相应虚拟工作子网的网关地址。结果表明ping命令测试正常。出故障的客户端系统现在还能正常上网吗?再次进行上网测试时,网管看到之前那种一会儿能上网一会儿不能上网的怪毛病已经消失了。显然,网络故障已被成功解决。
故障反射
虽然上述故障现象已经消失,但是让网管感到非常不解的是,为什么在网络连接断开的情况下,故障交换机的e0/8交换机端口仍然可以点亮,同时该端口仍然存在网络环路现象?网管经过仔细分析,认为交换机端口内部可能存在短路现象,直接导致目标交换机端口处于正常点亮状态,没有网络连接;当交换机的交换机端口短路时,相当于在对应的虚拟工作子网中形成一个网络环路。这种循环造成广播风暴现象,最终导致故障交换机工作性能的下降。显示的故障现象是上网速度慢
当然,这种网络故障发生在具有环路测试功能的交换机上,网管可以通过登录交换机后台系统快速找到具体的环路位置。但如果故障发生在不支持环路测试功能的交换机上,排查起来会比较麻烦。此时,我们可以在交换机所有网络连接断开的情况下,尝试重启一次交换机后台系统,仔细观察每个交换机端口的信号灯。如果发现一个交换机端口的信号灯在没有连接的时候还在闪烁,那么我们就可以确定这个交换机端口短路了。