大部分交換機都會有自我診斷的功能
當(dāng)交換機或者交換機端口由于某些原因出現(xiàn)故障的時候,都會通過指示燈來告知管理員存在的錯誤。不過有些時候交換機也會存在誤診斷的情況。如交換機的端口工作指示燈明明表示正常,但是用戶卻反映網(wǎng)絡(luò)不通。如果只是普通的用戶,問題還不是很大。但是如果這個端口恰巧是用來進行備份的,那么情況就會比較糟。為了避免這種情況,在實際工作中很多網(wǎng)絡(luò)管理員都喜歡采用交換機的UDLD模式來消除交換機的這種誤診斷。
一、什么情況下會出現(xiàn)誤診斷?
誤診斷的情形主要是即使當(dāng)鏈路或者交換機的端口指示燈正常的(即端口的狀態(tài)是UP的),但是接口仍然無法正常傳遞數(shù)據(jù)流量。通常情況才將這種錯誤稱之為單向鏈路。一般情況下,當(dāng)出現(xiàn)接口故障、軟件故障、硬件失效或者其他異常原因的時候,就會出現(xiàn)這種錯誤。憑現(xiàn)在的技術(shù)手段,交換機還不能夠從根本上避免這種錯誤的發(fā)生。為此只有采取其他的方式,加強對交換機端口的檢測,以盡早發(fā)現(xiàn)這種錯誤。在思科系列的交換機上,就采用了UDLD模式來解決這種情況下的誤診斷。
UDLD從理論上來說,其是在第二層工作的協(xié)議。不過從實際情況來看,其往往跟第一層的內(nèi)容有很深的關(guān)系。也就是說,UDLD模式不光光在第二層運作,其還會跟第一層的相關(guān)機制協(xié)同工作,才能夠完成。其主要的思路就是UDLD協(xié)議運行在第一、二層之間,最終確定鏈路的實際工作狀態(tài)。當(dāng)發(fā)現(xiàn)有“鏈路UP狀態(tài)正常,但是沒有傳遞流量”的時候,UDLD協(xié)議會馬上報警。
具體的說,在第一層中通過自動協(xié)商功能來觀測物理信令等相關(guān)的參數(shù)運作。而UDLD協(xié)議則會完成一些自動協(xié)商機制不能夠執(zhí)行的任務(wù)。讓自動協(xié)商發(fā)現(xiàn)物理信令有異常的時候,不會自動將端口從UP狀態(tài)轉(zhuǎn)換為其他狀態(tài),從而導(dǎo)致了單向鏈路的故障。而UDLD協(xié)議能夠接受來自自動協(xié)商機制傳遞來的參數(shù),然后再發(fā)現(xiàn)故障的時候及時的將交換機端口處于關(guān)閉狀態(tài)。可見,UDLD模式所采用的不只只是一種協(xié)議,而是UDLD協(xié)議與自動協(xié)商機制相互作用的結(jié)果。如果網(wǎng)絡(luò)管理員要啟動UDLD模式的話,那么就必須要同時啟用UDLD協(xié)議和自動協(xié)商機制,在第一層與第二層中通過他們的各司其責(zé)、協(xié)同工作,來防止物理上或者邏輯上的單向連接,從而從根本上消除交換機的誤診斷。
網(wǎng)絡(luò)管理員需要明白的是,UDLD并不是交換機原有診斷體系的補充,而是一種獨立的診斷方法。也就是說,它是從另一個角度對交換機各個端口的運行狀態(tài)進行自我診斷。兩者之間基本上沒有沖突或者重疊的地方。在實際工作中,傳統(tǒng)的診斷方法與UDLD模式經(jīng)常是同時使用。
二、合理配置UDLD模式下的各種參數(shù)
如果同時啟用了UDLD協(xié)議與自動協(xié)商機制,就啟動了UDLD模式,在這種情況下,交換機的某個接口會定期的向鄰近的端口發(fā)送UDLD協(xié)議數(shù)據(jù)報。在正常情況下,交換機的這個接口會在預(yù)定計時器到期之前接收到回應(yīng)的數(shù)據(jù)包。如果在這個計時器到期之前,交換機發(fā)送UDLD數(shù)據(jù)包的接口還沒有收到回應(yīng)信息,則UDLD協(xié)議就會認為出現(xiàn)了故障,即發(fā)生了單向鏈路的故障(其實更加精確的說,應(yīng)該是自動協(xié)商發(fā)現(xiàn)了這個故障并告知了UDLD協(xié)議)。當(dāng)UDLD知道這種情況后,會馬上關(guān)閉有問題的交換機接口。
在UDLD配置的時候,首先需要考慮這個計時器。也就是說,將這個時間設(shè)置為多少為好。如果時間設(shè)置的比較短,不僅會造成不必要的數(shù)據(jù)流量,而且也有可能因為數(shù)據(jù)延遲等原因?qū)е聼o法在合理的時間內(nèi)接到回應(yīng)的數(shù)據(jù)包。而如果將這個計時器的時間設(shè)置的比較長的話,那么就可能無法在短時間內(nèi)發(fā)現(xiàn)問題。要知道,可能一分鐘對于用戶來說,沒有多少感覺。但是對于數(shù)據(jù)網(wǎng)絡(luò)傳輸來說,這個時間就很長了。默認情況下,這個計時器是15秒。
在實際工作中,網(wǎng)絡(luò)管理員可能需要根據(jù)不同的情況來合理設(shè)置這個參數(shù)。如需要根據(jù)企業(yè)網(wǎng)絡(luò)的復(fù)雜情況、布線的長短來考慮。如根據(jù)以前的情況,企業(yè)可能經(jīng)常會遇到網(wǎng)絡(luò)堵塞等情況,而這種堵塞也是暫時的,那么要適當(dāng)延長這個計時器等等。筆者的建議是在剛開始的時候可以將這個計時器設(shè)置的長一點,然后慢慢的減短。最后得到一個合理的數(shù)值。
|