交換機常見故障分類與排除方法
來源:弱電工程師的圈子 編輯:小月亮 2020-12-23 19:08:37 加入收藏
交換機在網(wǎng)絡建設中使用得非常普遍。與此同時在日常工作中,交換機故障的現(xiàn)象是多樣的,故障的原因也是多樣的,本文將交換機分為硬件和軟件故障,并針對性地進行分析,逐類排除。
一、交換機故障分類:
交換機故障一般可以分為硬件故障和軟件故障兩大類。硬件故障主要指交換機電源、背板、模塊、端口 等部件的故障,可以分為以下幾類。
(1)電源故障:
由于外部供電不穩(wěn)定,或者電源線路老化、靜電或者雷擊等原因?qū)е码娫磽p壞或者風扇停止,從而不能正常工作。由于電源緣故而導致機內(nèi)其他部件損壞的事情也經(jīng)常發(fā)生。
針對這類故障,首先應該做好外部電源的供應工作,通過引入獨立的電力線來提供獨立的電源,并添加穩(wěn)壓器來避免瞬間高壓或低壓現(xiàn)象。一般來說,有兩路電供電,但由于各方面的原因,不可能為每臺交換機提供雙路供電,可以添加UPS(不間斷電源)來保證交換機的正常供電,最好使用提供穩(wěn)壓功能的UPS。另外還要在機房內(nèi)設置專業(yè)的避雷措施,來避免雷電對交換機的傷害。
(2)端口故障:
這是最常見的硬件故障,無論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時一定要小心。如果不小心把光纖插頭弄臟,可能導致光纖端口污染而不能正常通信。我們經(jīng)常看到很多人喜歡帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了端口的故障發(fā)生率。在搬運時不小心,也可能導致端口物理損壞。如果購買的水晶頭尺寸偏大,插入交換機時,也容易破壞端口。此外,如果接在端口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會導致所連交換機端口被擊壞,或者造成更加不可預料的損傷。
一般情況下,端口故障是某一個或者幾個端口損壞。所以,在排除了端口所連計算機的故障后,可以通過更換所連端口,來判斷其是否損壞。遇到此類故障,可以在電源關閉后,用酒精棉球清洗端口。如果端口確實被損壞,那就只能更換端口了。
(3)模塊故障:
交換機是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴展模塊等。這些模塊發(fā)生故障的機率很小,不過一旦出現(xiàn)問題,就會遭受巨大的經(jīng)濟損失。如果插拔模塊時不小心,或者搬運交換機時受到碰撞,或者電源不穩(wěn)定等情況,都可能導致此類故障的發(fā)生。
當然上面提到的這3個模塊都有外部接口,比較容易辨認,有的還可以通過模塊上的指示燈來辨別故障。比如:堆疊模塊上有一個扁平的梯形端口,或者有的交換機上是一個類似于USB的接口。管理模塊上有一個CONSOLE口,用于和網(wǎng)管計算機建立連接,方便管理。如果擴展模塊是光纖連接的話,會有一對光纖接口。
在排除此類故障時,首先確保交換機及模塊的電源正常供應,然后檢查各個模塊是否插在正確的位置上,最后檢查連接模塊的線纜是否正常。在連接管理模塊時,還要考慮它是否采用規(guī)定的連接速率,是否有奇偶校驗,是否有數(shù)據(jù)流控制等因素。連接擴展模塊時,需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當然如果確認模塊有故障,解決的方法只有一個,那就是應當立即聯(lián)系供應商給以更換。
(4)背板故障:
交換機的各個模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導致機內(nèi)溫度升高,指使元器件燒壞。
在外部電源正常供電的情況下,如果交換機的各個內(nèi)部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況惟一的辦法就是更換背板了。但硬件更新后,同一名稱的電路板塊可能有多種不同的型號。本文由公眾號云極安整理,在一般情況下,新型號電路板的功能會兼容舊型號電路板的功能。但舊型號的電路板的功能,就不一定能兼容新型號電路板的功能了。
(5)線纜故障:
連接電纜和配線架的跳線是用來連接模塊、機架和設備用的。如果這些連接電纜內(nèi)的纜芯或跳線發(fā)生了短路、斷路或虛接,就會形成通信系統(tǒng)的故障。
從上面的幾種硬件故障來看,機房環(huán)境不佳極易導致各種硬件故障,所以醫(yī)院在建設機房時,必須先做好防雷接地及供電電源、室內(nèi)溫度、室內(nèi)濕度、防電磁干擾、防靜電等環(huán)境的建設,為網(wǎng)絡設備的正常工作提供良好的環(huán)境。
二、交換機的軟件故障:
交換機的軟件故障是指系統(tǒng)及其配置上的故障,它可以分為以下幾類。
(1)系統(tǒng)錯誤:
程序BUG:軟件程序設計存在著缺陷。交換機系統(tǒng)是硬件和軟件的結(jié)合體。在交換機內(nèi)部有一個可刷新的只讀存儲器,它保存的是這臺交換機所必需的軟件系統(tǒng)。由于當時設計的原因,存在一些漏洞,在條件合適時,會導致交換機滿載、丟包、錯包等情況的發(fā)生。
對于此類問題,我們需要養(yǎng)成經(jīng)常瀏覽設備廠商網(wǎng)站的習慣,如果有新的系統(tǒng)推出或者新的補丁,請及時更新。
(2)配置不當:
由于各種交換機配置不一樣,網(wǎng)絡管理員往往在配置交換機時會出現(xiàn)配置錯誤。主要錯誤有:
1、系統(tǒng)數(shù)據(jù)錯誤: 系統(tǒng)數(shù)據(jù),包括軟件設置,用于對整個系統(tǒng)進行定義。如系統(tǒng)數(shù)據(jù)出現(xiàn)錯誤,也會造成系統(tǒng)全方位的故障,對整個交換局產(chǎn)生影響。
2、局數(shù)據(jù)錯誤: 局數(shù)據(jù)是根據(jù)交換局的具體情況而定義的。當局數(shù)據(jù)出現(xiàn)錯誤時,也會對整個交換局產(chǎn)生影響。
3、用戶數(shù)據(jù)錯誤: 用戶數(shù)據(jù)對每一個用戶的情況進行定義,如果用戶數(shù)據(jù)被錯誤設置,會對某個用戶產(chǎn)生影響。
4、硬件設置不合適: 硬件設置是為減少電路板的種類,而在電路板上設置的一組或幾組開關,用以定義該電路板的工作狀態(tài)或在系統(tǒng)中所處位置,如硬件設置得不正確,必會導致該電路板工作不正常。
這類故障有時很難發(fā)現(xiàn),需要一定的經(jīng)驗積累。如果不能確定配置是否有問題,請先恢復出廠默認配置,然后再一步一步地配置。最好在配置之前,先閱讀說明書。
(3)外部因素:
由于病毒或者黑客攻擊等情況的存在,有可能某臺主機向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成交換機處理器過分繁忙,致使數(shù)據(jù)包來不及轉(zhuǎn)發(fā),進而導致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風暴,它不僅會占用大量的網(wǎng)絡帶寬,而且還將占用大量的CPU處理時間。本文由公眾號云極安整理,網(wǎng)絡如果長時間被大量廣播數(shù)據(jù)包所占用,正常的點對通信就無法正常進行,網(wǎng)絡速度就會變慢或者癱瘓。
總之,軟件故障應該比硬件故障較難查找,解決問題時,可能不需要花費過多的金錢,而需要較多的時間。要網(wǎng)絡管理員在平時的工作中養(yǎng)成記錄日志的習慣。每當發(fā)生故障時,及時做好故障現(xiàn)象記錄、故障分析過程、故障解決方案、故障歸類總結(jié)等工作,以積累自己的經(jīng)驗。每解決一個問題后都用心的去回顧問題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網(wǎng)絡管理的重任。
評論comment