|
||||
網絡故障的現象有很多,即使同一個故障的表面現象也可能不一樣,所以作為一名網管員,要善於抓住問題的本質,用最快的速度去排除故障。這裡介紹用分層和分段的方法去逐步找到故障的原因。
所謂分層的思路,是把OSI七層模型和現實的網絡環境相對應,從高到低地判斷故障。一般主要是考慮七層模型的下三層的對應關系,即把維護的網絡設備的各種故障現象歸類到物理層、鏈路層和網絡層,其中物理層的故障一般很好理解,所以把鏈路和物理層放在一起,如圖所示。
比如調制解調器的燈指示的是物理層的信息,CD代表載波,不亮的話指示電話線的連接有問題。CTS代表與電腦的接口是否正確地連接,不亮的話要麼是連接線有問題,要麼就是RS232口有問題。網卡的Link燈代表網線的好壞或者與Hub的連接是否正確,網卡的100M燈代表是否是100M連接。大中型的服務器上一般都有液晶的小條,實時顯示服務器的運行狀態,可以從中看出設備的故障情況。大部分網絡設備的物理層的信息雖然標識一樣,但在細節上很不相同,需要仔細研讀產品說明書來了解。
從鏈路層開始就需要對網絡協議有比較清晰的了解。在網絡中運行的設備一般都嚴格遵守七層協議,可以運用網絡規程儀表對網絡進行監控,也可以運用本地環或者遠端環對線路的質量進行檢查。在以太網上,一般可以運用Sniffer對所有的包進行竊聽來判斷故障的位置。目前交換機普及後,也可用在交換機上觀察各以太口上獲得的MAC地址來判斷故障。鏈路層的信息一般和物理層的信息交織在一起,除非出現誤碼率高和設備運行狀態不穩定等,都不需要對鏈路層進行排障。
到了網絡層,隨著故障的復雜化,網絡管理員可以運用的工具也多了。在IP網絡上,一般用Ping來判斷網絡的通斷,可以用traceroute來跟蹤路由的方向,當然也可以利用網絡設備內部提供的豐富的命令來查看設備內部的運行情況。比如Cisco設備的show命令就提供了很多選項,可以看到設備的各種信息。各種網管軟件使用SNMP協議從各種設備上取出各種出錯信息,來幫助網管員正確判斷故障所在。從網絡層再往上,故障一般都和應用程序的設置有關了,比如SQL數據庫和C/S軟件方面的問題,這時排障要和應用軟件管理員一起來排除了。