局域網(wǎng)廣播為何會失控?環(huán)路怎么壓???
企業(yè)局域網(wǎng)最怕的不是帶寬不夠,而是二層拓撲被誤改后故障在幾秒內(nèi)擴散。廣播風暴和環(huán)路不是兩個獨立問題,前者往往是后者被交換芯片放大的表象。
廣播報文在二層不會被某個電機“吸收”,交換機只能按同一VLAN復(fù)制到多個端口。當接入口后面接了小交換機、攝像頭橋接口,或一根備用跳線把兩個樓層弱電箱重新閉成環(huán)時,ARP請求、DHCP發(fā)現(xiàn)以及未知單播都會被重復(fù)轉(zhuǎn)發(fā)。真正先失控的通常不是總帶寬,而是地址學(xué)習表:同一MAC在不同端口來回出現(xiàn),CAM表不斷重學(xué),控制平面又被異常報文搶占,于是語音、門禁和打印這類小流量業(yè)務(wù)先表現(xiàn)為隨機抖動。很多園區(qū)網(wǎng)絡(luò)排障時只看端口平均利用率,平均值不高卻已經(jīng)出現(xiàn)突發(fā)洪峰,用戶體感往往比監(jiān)控告警更早。它成立的前提是廣播復(fù)制沒有被邊緣限流,或者未知單播、未知組播被當成“正常流量”放過去。機制鏈條是復(fù)制放大、地址漂移、中央處理器搶占、轉(zhuǎn)發(fā)表失真,工程上要同時限制三類泛洪,而不是只給廣播單獨設(shè)閾值。
環(huán)路能否被壓住,關(guān)鍵不在配置里有沒有快速生成樹,而在生成樹是否真的參與了邊緣變化。很多事故出在接入口被誤設(shè)成干道口,或上聯(lián)口被開啟了快速接入模式,交換機把本應(yīng)接收橋協(xié)議數(shù)據(jù)單元的鏈路當成終端口,環(huán)路出現(xiàn)時不會先阻塞而是先放行??焖偕蓸涫諗靠?,但它依賴根橋穩(wěn)定、橋協(xié)議報文不被過濾、鏈路角色明確;只要雙上聯(lián)中有一端單向故障,未配單向鏈路檢測或環(huán)路保護的一側(cè)就可能誤判拓撲健康,繼續(xù)轉(zhuǎn)發(fā)舊路徑。如果接入口下掛的是會議終端或傻交換機,還應(yīng)限制可學(xué)習地址數(shù)量,避免一個違規(guī)小設(shè)備把故障繼續(xù)向下游擴散。工程上應(yīng)把核心和匯聚固定成根橋與備根,所有接入口默認啟用BPDU Guard,非授權(quán)干道口直接關(guān)閉,邊緣口模板里禁止手工刪除保護項。把“誰可以形成閉環(huán)”從人工經(jīng)驗改成配置約束,才是避免風暴反復(fù)出現(xiàn)的辦法。
局域網(wǎng)里的廣播故障本質(zhì)上是拓撲控制失敗。先限復(fù)制,再穩(wěn)根橋,再把邊緣端口的越權(quán)接入擋掉,環(huán)路和風暴才會一起下降。





