按照計算機故障性質可以將網(wǎng)絡故障分為硬件故障和軟件故障兩大類。在計算機發(fā)生故障時通常應該首先查看硬件,當排除了硬件故障后,再查看軟件問題。
故障診斷作為一項比較復雜的工作,并沒有一個通用的法則可以遵循。但是,許多網(wǎng)絡管理員在長期與故障打交道的過程中,積累了豐富的經(jīng)驗,并提出了故障診斷的一般步驟,這個步驟如下。
• 分析故障現(xiàn)象。
• 定位故障范圍。
• 隔離故障。
• 排除故障。
下面是具體分析故障排錯的步驟。
(1)認清癥狀。仔細記錄從其他人或系統(tǒng)中學來的解決問題的方法,并把它放在手頭。
(2)驗證用戶權限。例如,確保用戶正確輸入了他的口令。
(3)限定問題的范圍。它是全局性的嗎?即網(wǎng)上的所有用戶總是會碰到這個問題嗎?或者問題只發(fā)生在網(wǎng)絡上某一地理區(qū)域,某一特定的工作組,某一特定的時間段。
(4)重現(xiàn)故障,并且要保證能夠可靠地重新產(chǎn)生這個錯誤。
(5)驗證網(wǎng)絡物理連接(例如網(wǎng)絡連線、網(wǎng)絡接口卡的插槽、供電電源)的完整性。從受到影響的節(jié)點開始,向主干網(wǎng)延伸。
(6)驗證網(wǎng)絡的軟件連接問題(例如地址、協(xié)議綁定、軟件安裝等)。
(7)考慮近的網(wǎng)絡變更和可能因此導致的網(wǎng)絡問題。
(8)實施解決方案。
(9)檢驗解決方案。
根據(jù)自己的觀察,可以從上面列表中的一步跳到另一步,減少所執(zhí)行的檢查步驟。例如,如果檢測到一個網(wǎng)絡接口卡在工作站系統(tǒng)板上的安裝不正確,就可以直接跳到步驟(8)(在本例中,就是重新安裝網(wǎng)絡接口卡),而不用分析網(wǎng)絡的近變化情況??傊谂佩e時需要利用常識。