用交换机组网已经成为很多网络管理员的最佳选择,所以交换机的性能将直接影响局域网的整体性能。一般来说,二层交换机出现故障的概率并不大,但是笔者最近遇到的一个奇怪的网络故障就和二层交换机有关。这种因素导致的故障现象具有很强的隐蔽性,所以作者在解决这类故障时走了很多弯路!为了避免朋友们走弯路,现在我回放一下故障排除过程,希望对大家有所启发!
故障现象:二层交换网络阻塞。
局域网内有42台计算机和一台文件服务器,其中普通计算机通过两台二层交换机直接连接到局域网核心交换机,文件服务器直接连接到核心交换机,核心交换机通过自身的路由功能直接连接到Internet网络。通常局域网内的所有电脑都可以顺利访问文件服务器,访问Internet网络中的内容也很方便。然而,我不知道最近发生了什么。突然,局域网中的一些计算机无法访问文件服务器中的内容,但其他计算机仍然可以正常访问文件服务器中的内容。故障发生的第一时间,笔者立即赶到局域网的中心机房,仔细检查了局域网内一些主要网络设备的工作状态,发现局域网内某二层交换机所有端口的信号灯都工作不正常。所有一直闪烁和点亮的灯现在都处于点亮但不闪烁的状态。显然,所有连接到第2层交换机的计算机都无法访问网络。
故障排除:交换机是否有硬件损坏?
一开始笔者简单的认为这种故障现象一定是交换机运行时间长了缓存溢出错误导致的,而这种因素导致的故障现象经常发生。我们只要切断交换机的电源,并在一段时间后重新启动交换机设备,就可以很容易地使交换机的工作状态恢复正常。根据这个想法,作者立即关闭第二层交换机的电源,让设备‘休息’大约五分钟,然后打开它的电源,重新启动它。系统稳定启动后,笔者随机找了一台故障电脑进行入网测试。测试发现,以前无法访问的文件服务器现在可以访问了。本以为这样就成功解决了故障,没多久之前的网络故障又‘卷土重来’了。
既然重启交换机不能解决故障现象,那么是不是局域网出现了网络病毒或者其他故障?虽然笔者知道单位局域网内很多电脑都感染了各种网络病毒,但如果这次网络故障真的是网络病毒引起的,为什么局域网内另一台同型号的交换机还能正常工作?这里笔者估计很可能是故障交换机的硬件损坏。
考虑到交换设备可能发生硬件损坏的地方主要是背板部分、模块部分、电源部分、端口部分等。为此,作者打算依次考察这些部分。在检查交换机的连接端口时,笔者认为交换机端口不可能在某一时刻集体‘罢工’。如果要损坏,只能是一个或几个端口意外损坏。但目前的情况是,所有连接到故障交换机的电脑都无法上网,这说明交换机端口损坏的可能性很小。至于电源部分,由于故障开关可以正常接通电源,所有信号灯都亮着,所以笔者估计电源损坏的可能性也很小。由于交换机的连接端口和电源部分不容易出错,所以最容易出错的部分自然是交换机的模块部分或者背板部分。当然,如果这些部件的硬件损坏,网络管理员唯一能做的就是更换其他正常的交换设备。
考虑到单位暂时没有可更换的开关,我打算向单位领导申请先购买一个新开关,等新开关到位后再更换。在一些故障电脑无法接入网络的同时,笔者准备先清理一下困扰它们的网络病毒,尽可能的消除局域网中潜伏的各种危险因素。在清理网络病毒期间,笔者确实从局域网中发现了不少网络病毒。笔者随意查阅了其中一种网络病毒的详细资料后,看到这种类型的网络病毒可以在局域网内造成广播风暴现象。
看到这样的文字,作者脑海中突然闪过一个想法。有没有可能是广播风暴现象导致交换机坏了?考虑到目前局域网内的病毒已经全部清理完毕,笔者估计病毒引起的广播风暴现象也应该会自动消失,所以交换机的工作状态应该可以恢复正常;在这里,作者立即将故障开关重新连接到局域网,并打开其电源。开始时,开关控制面板中的信号灯显示正常工作状态。此时,当从故障电脑上访问互联网时,笔者发现网络故障现象已经消失。为了防止故障现象长时间后再次出现,笔者这次留在了机房,观看故障开关的信号灯变化。然而,十分钟过去了,开关控制面板中的信号灯仍处于正常工作状态,因此作者断定网络故障不会再次发生。果然,时间久了,局域网内无法访问文件服务器的电脑依然可以正常访问网络,说明交换机导致的网络故障现象已经被成功排除。
故障排除:谁是幕后的‘真凶’?
虽然交换机导致网络故障的现象已经解决了,但是笔者直到现在还是不明白。既然清除了网络病毒,那么故障交换机的工作状态就可以恢复正常,也就是说网络病毒是网络故障的‘罪魁祸首’,但是为什么网络病毒不会影响到另外的二层交换机呢?
后来,笔者在网上查阅相关资料后,找到了幕后的‘真凶’。原来有故障的交换机“服务”了相对长的时间,这导致交换机的性能恶化。但老化的交换机抗网络病毒能力差,最终导致交换机瘫痪。而另一台工作时间相对较短的交换机没有性能老化现象,因此不容易受到网络病毒的攻击,最终性能也没有受到损害。