网络故障汇编(doc44)-经营管理(编辑修改稿)内容摘要:

系统也就不能观察计费服务器的端口工作状态。 在平时的维护工作中,该计费中心的维护人员基本上不用网管系统定期观测并记录网络的工作参数,当故障出现时就不能觉察到服务器工作速度的变化。 有趣的是,如果电缆没有问题,即使将链路速度设置为 10Mbps,计费服务器应该还是能正常工作的 (计费信息的网络流量一般不高 )。 在本故障中,计费服务器繁忙时由于碰撞率和错误率太高,服务器无法处理一部分数据包,其中已经被 “ 挂号 ”的部分数据包将被丢弃,造成计费数据不准确。 [诊断建议 ]布线系统平时要定期轮测 (一至两年轮测意义遍 )。 更换链路元件后一定要对链路进行测试(尤其是 100Mbps 链路,必须用电缆测试仪测试 )。 网管系统要指定专人进行维护使 用,一般来讲,网管系统可以覆盖约 35%左右的网络故障,因此强烈建议重要的网络要安装支持 SNMP或 RMON 协议 (多数网络设备都支持 SNMP 协议,部分支持 RMON),启动已有 SNMP、 RMON 等功能的网络设备,否则网管系统将形同虚设。 维护工作要求有及时完整的记录,这对提高处理故障的速度是非常必要的。 [后记 ]经过一个月的运行,收费系统 “ 贡献 ” 了 35%的收入额,大喜。 [案例七 ]5 类线 Cat5 勉强运行千兆以太网 [症状 ]某期货交易所,网络改造为千兆以太网后只有 1 个网段能正常工作,其它 12 个网段工作 均不正常,数据时有出错,连接经常会莫名其妙地中断。 每个网段用千兆以太网连接起来,下挂的网段均是100Mbps用户端口。 起初怀疑是系统运行的平台或者软件有问题,经过多次重新安装和设置仍不能解决问题,而且同样的系统在其它地方的交易网络中应用是正常的。 因而转向怀疑是否是布线系统的问题,比如电缆不合格或是有干扰信号串入以及接地系统等方面的问题。 每个网段均利用升级前铺设的电缆系统连接起来,未作大的更改。 由于计算机网络的布线系统采用的是标准的 5 类线方案,根据千兆网的设计标准,采用 4 对线全双工工作, 5 电平编码,占用的信号 物理带宽正好是 100MHz,故 5 类线应该是完全可以胜任的,况且一般情况下期货交易网络现有的流量水平远不能达到满载运行的程度,流量很低。 重新用专业电缆测试仪作过严格的认证测试,显示参数合格并且不存在脉冲噪声干扰或接地方面的问题。 所谓能工作的那一个网段是因为行情和交易服务器都安装在该网段中,本网段内的工作站与服务器除了个别站点外都可以上网连接工作,进行行情浏览和交易割接。 其它网段内的服务器对内连接时除了个别工作站外也基本正常,共同特点都是不能与行情服务器和交易服务器所在网段实现良好连接。 系统升级时原布线 电缆全部保留不动,经过测试也全部合格,不知原因何在。 [诊断过程 ]不能连接的因素很多,象网络硬件设备的功能设置问题、布线系统的问题、操作平台的安装设置问题、应用软件的安装设置和软件冲突方面的问题等等。 从用户所反映的情况分析,各个网段内的站点基本上全部能工作,网段之间的连接比较困难,可以初步确定故障出现在网络设备设置和布线系统性能等方面的可能性大一些。 将网络测试仪 F68X 接入能连接服务器和交易服务器的网段 (100Mbps),观察网络流量 5 分钟平均为12%, FCS 帧校验错误帧约 11%,碰撞率 % (正常范围 )。 显然 FCS 帧校验错误比例偏高,查看错误源,显示为其它网段站点产生 FCS 帧错误的比例占错误帧总量的 97%。 各网段的错误帧比例差别不大。 由于有大量的 FCS 帧普遍存在,所以各网段内的各站点同时出问题的可能性很小,用 F683 向各网段内的服务器或站点发送流量, FCS 帧错误随流量增高而迅速增加,各站点或服务器反映基本一致。 启动网络测试仪的 ICMP Ping 功能,统计对各网段内选定的站点和交换机、路由器等的测试结果,表现基本一致,即: ICMP Ping断层约 96%, ICMP Monitor 显示目标不可达 占 91%。 改在其它网段内作同样内容的测试,对行情服务器和交易服务器所在网段的路由器和交换机结果基本与前项测试相同。 所不同的一点是,对其它网段内的交换机和路由器等网络设备的测试结果显示是正常的,数值为: ICMP Ping 断层为 0%,全部可以通达, ICMP Monitor 目标不可达为 0%。 基本可以肯定,故障出在行情服务器网段与其它网段的连接链路上。 用 FLUKE公司的 DSP4000 电缆认证测试仪选用 TIA Cat5n Channel UTP100 标准测试,显示长度为 25 米,链路测试不合格。 其中,回波损耗 RL 和衰 减串扰比 ACR 等参数超差。 改用同样长度的一根超 5 类线 Cat5e 代用之,启动系统,除了各网段内个别站点外,整个网络恢复正常。 监测高峰时的流量,服务器所在网段最高时平均流量为 3%,可见故障时 12%的流量主要都来自大量的重发帧流量。 [诊断评点 ]千兆以太网可以满足网络用户对大带宽应用的 “ 贪婪 ” 胃口,无疑是网络下一步的重点发展方向。 千兆以太网的设计者在选用电缆类型时对 5 类线 Cat5 已经存在的应用规模考虑比较多,所以选择的物理带宽为 100MHz。 这样,原则上 5 类线是可以运行千兆以太网的。 但实际的统计结果表明, 仍有 1%~5%的用户不能上网或连接出现断续和困难。 也就是说,千兆以太网对 5 类线的参数要求更严格一些。 只要用户对 5 类线布线系统进行过严格的认证测试,可以保证绝大多数的站点是可以联网工作的。 少数站点因为某些参数余量小可能有上网困难的现象。 影响比较大的参数有综合近端串扰 PS NEXT、综合远端串扰 PS FEXT、等效远端串扰 ELFEXT、综合等效远端串扰 PS ELFEXT、回波损耗 RL、衰减串扰比 ACR 等。 此时需要对 5 类线进行 Cat5n标准测试,该标准是专为用 5 类线运行千兆以太网的用户准备的,如果依循该标准测试都 合格,则可以放心地用 5 类线系统运行千兆以太网。 新的 Cat5n标准中,回波损耗对系统的影响比较大,并且,由于电缆匹配方面的阻抗不连续问题,越短的电缆链路反而越容易出问题。 本例中,由于电缆长度为 25 米,虽然衰减串扰比 ACR参数也不合格,但,回波损耗引起本故障的可能性要大些。 [诊断建议 ]对 5 类线的认证测试可以适当考虑选用 Cat5n 标准进行测试,这样可保运行千兆以太网网时不出问题。 如果选用超 5 类线 Cat5e进行布线,则一般不会有不能运行千兆以太网之虞。 对用 Cat5n 标准诊断出来有问题的 5 类线链路,为了以最 小的成本换来网络性能的提高,一个最简单的办法就是用超 5类线 Cat5e 代换参数不良的个别链路。 注意,联结模块最好一并更换,以保证链路的安装质量。 [后记 ]遵循我们的建议,两周后该期货交易所将全部的安装链路用 DSP4000 电缆测试仪选用TIACat5n 标准进行了测试,全部站点数为 1300 个,不合格链路 21 个。 对不合格的链路改用超 5 类电缆后所有站点均工作正常,网络状态保持优良 (该网络平均流量高峰时才 3% ) [案例八 ]电缆超长, LAN 可用, WAN 不可用 [症状 ]今天的病人是某进出口公司,开通 DDN 专线后部分用户抱怨数据交换的速度变慢,且经常有联结中断的现象。 网络支持人员虽经多方查找仍不得要领,故请求网络医院出诊援救。 该公司的网络结构原先是单纯的局域网,分布在三层楼面中,共有 300 个站点,每个楼层有 100 个左右的用户。 配线间设在最上面一层的楼层中,用交换机将各楼层共分成三个网段。 以前员工均使用拨号上网方式实现与 Inter 的联结,自我感觉网络速度还比较快,工作一直很正常。 新近增加了路由设备,并申请开通了 DDN 专线。 每个楼层用集线器将用户联结起来,结果最低楼层的员工反映有时速度很慢,并常 有莫名其妙的中断现象。 由于该公司没有配备任何网络监测工具,且在局域网内传输数据不受影响,只在上Inter 网时才有麻烦,故直到工程竣工两周后才向网络医院求援。 [诊断过程 ]该公司的网络为 10BaseT 局域网,此次只增加了 DDN 设备和路由器,其它配置基本不变。 故将网络测试仪 F68X 从最低楼层的某个用户端接入网络进行观察,平均流量为 %,未发现异常。 改用流量发送功能作流量逐级递增的体能测试,也未发现任何异常。 表面上看,该网段似乎没有什么问题。 为快速定位网络故障,将流量发送到其它网段,同时观察网络状况。 随着发送流量的增加, 1 分钟后发现错误帧,帧类型为 FCS 错误帧,并指示 FCS 帧来自第二层的某个用户。 显然,只据此现象就判断故障原因为该工作站的网卡损坏或网卡驱动程序错误,似乎显得 “证据不足 ”,因为整个楼层的用户反映的故障现象是相同的。 继续观察到 5 分钟,发现 FCS 错误帧数量增加为 10 个用户左右,由此可以断定不是某个工作站的问题。 为此,令其它楼层多个用户与故障楼层用户交换数据 (比如拷贝文件 ),结果发现多个 FCS 帧错误。 打开交换机端口工作表观察,本楼层的记录中也显示 FCS 帧错误,而其它的交换机端口工作表中没有 FCS错误记录 (交换机为非切发型交换机 ),这说明是本网段内存在者线缆超长的链路。 再试着向 Inter 某个已知用户发送流量,并且进行 ICMP Ping 测试,结果发现损失率为 90%左右。 由于刚才本网段内的体能测试未发现异常,所以只能是集线器与交换机联结的单条链路有问题。 测试该电缆,长度指示为 175 米。 超长。 [诊断评点 ]根据网络规范,以太网为碰撞侦听共享介质方式工作的。 每个工作站到集线器的网线长度应不超过 100 米,方可保障无延迟碰撞 (同轴电缆 )或 FCS 帧错误。 由于 175 米超常链路在集线器和交换机之间,所以 本网段内的用户在交换数据时可以顺利进行。 但与其它网段的用户交换数据时就可能处问题。 但由于网络平均流量低,虽然在整个局域网内存在 FCS 帧错误影响,对低流量局域网内的数据交换而言,其对速度的影响甚微。 当同时有多个用户通过 DDN 进行 WAN数据交换时, FCS 帧错误将导致 64K 的出口流量浪费加大。 这是因为 64K 比 10Mbps 的速度要低得多,流量中错误帧的比例较高,进入 WAN 链路时可能要经过多次重发才能实现远程数据交换,感觉网络速度明显变慢。 且由于经常有 FCS 错误帧,较容易引起 WAN链路联结时因错误而中断,综合表现为故 障楼层的所有用户都抱怨速度变慢且常中断。 [诊断建议 ]网络速度低时很多故障现象都将被掩盖起来。 建议网络拥有者在新的网络工程结束时应该进行两项验收:网络布线系统现场认证测试和网络验收测试 (最起码要作体能测试和加载条件下的逐个工作站的模拟上网测试 )。 [后记 ]一周后该公司重新划分网段施工结束,用户来电报告一切正常。 [案例九 ]线缆连接错误,误用 3 类插头,致使网络升级到 100BaseTX 网络后无法上网 [症状 ]某船运公司,为满足日益增长的业务需求,三周前开始网络升级改造工程,按设计规划 将 10BaseT网络全部升级为 100BaseTX 以太网,电缆系统不作任何改动。 昨天设备安装调试工程全部结束,今天凌晨开始网络割接作业。 所有工作站更换 100BaseTX 以网太网卡,然后分批接入网络。 此时工程人员发现一些奇怪现象,比如:有些工作站不能联入网络;有些工作站第一次可以联入网络,过一段时间再次连接则无法进入;有的工作站开始时能联入网络并且工作很正常,但过一段时间后则出现连接断续或数据出错的现象。 集成商起先以为是网络平台安装不当,遂将系统平台重新清理并安装了一次,出问题的工作站系统软件和应用软件也进行了 重新安装,结果毫无改善。 “折腾 ”了将近一整天,也无法为用户提供服务,业务基本中断。 [诊断过程 ]接到报告后立即赶到 “ 出事地点 ” ,启动包括故障工作站在内的全部系统成员进入网络运行。 用 F683 网络 “ 万用表 ” 对故障网络首先作常规健康测试,一分钟后测试结果如下:网络利用率 %(此时员工已经全部下班 ),碰撞率 8%,错误率 11%,广播 9%。 显然网络碰撞率和错误率比较高,打开错误诊断定位功能,显示 FCS 帧错误、本地碰撞、碎帧等错误计数。 这说明网络可能存在网卡工作失常、电缆系统故障、干扰或接地回路等方面的问题。 查看具体的 FCS 错误帧测试结果,发现有许多工作站发出错误的 FCS 数据帧。 一般来将,同时存在多个网卡失效的故障是不大可能的,此时的 FCS帧错误多数由电缆问题尤其是有超长链路的电缆问题所引起而不是由网卡所引起。 但为慎重起见,我们先随机抽查其中两张网卡进行测试,结果正常,再测试对应的集线器端口,其物理参数结果正常,工作协议匹配无异。 由此则可以有把握地确定故障的原因是由电缆系统的问题引起的。 用户告知,本系统采用的是五类线,共有 270 台工作站,划分为 6 个网段,有一个专网路由器和一个公网路由器,升级前一直工作在 10BaseT以太网状态,整个系统除了业务一部经常反映网络速度偏慢和偶尔的连接断续外,其它部门使用状况一直很正常 (业务一部工作量最大 )。 今天开始升级工作后部分工作站出现上面提到的各种故障现象,涉及范围大约有近三分之一的工作站。 询问用户以前是否对布线系统进行过测试,答曰: “ 只测试过通断,因为在 10BaseT以太网一直能上网,所以布线系统应该不会有问题。 ”为快速定位故障,随机抽取了其中 10 条有问题的链路进行测试,结果为:一分二插座故障 8 个, 3 类线连接模块 3 个,综合近端串扰 PS NEXT 参数不合格 4 个。 检测。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。