一、當最后100米無(wú)線(xiàn)化
所有對網(wǎng)絡(luò )故障維護有較長(cháng)期經(jīng)驗的人都清楚,早期網(wǎng)絡(luò )大概75%左右的故障來(lái)自于物理連接故障,也就是來(lái)自于網(wǎng)線(xiàn)或物理接口。后期伴隨綜合布線(xiàn)理念的貫徹與執行,制造工藝的提升,線(xiàn)纜與接口質(zhì)量的提升,這一故障的比例大幅度降低了。那么當我們的最后100米無(wú)線(xiàn)化之后,網(wǎng)線(xiàn)和物理接口會(huì )出現什么樣的情況呢?
1.1 靈活性的大躍進(jìn)與技術(shù)本身的退步
首先我們應該有一個(gè)明確的認識,無(wú)線(xiàn)WLAN網(wǎng)絡(luò )事實(shí)上是網(wǎng)絡(luò )靈活性的提升和網(wǎng)絡(luò )技術(shù)的倒退。從技術(shù)角度講,WLAN本身將網(wǎng)絡(luò )技術(shù)倒退了至少5-10年,即從交換式以太網(wǎng)年代退回到共享式以太網(wǎng)年代。這種倒退從物理介質(zhì)角度而言尤甚,因為在當前的交換式以太網(wǎng)技術(shù)中,每個(gè)用戶(hù)是獨享傳輸介質(zhì)的,但是在無(wú)線(xiàn)技術(shù)中,所有的用戶(hù)共享物理信道,只要用戶(hù)間相互可見(jiàn),無(wú)論有多少個(gè)AP,所有工作在同一頻點(diǎn)的用戶(hù)共享相同的物理介質(zhì)。這就是典型的同軸共享式以太網(wǎng)或基于HUB的共享式以太網(wǎng)的特征。
那么在共享式以太網(wǎng)里需要考慮的物理數據碰撞、網(wǎng)絡(luò )用戶(hù)量與數據量規模無(wú)法無(wú)限擴展等問(wèn)題重新歸來(lái),因此網(wǎng)絡(luò )排錯時(shí)需要考慮的因素增加了。
1.2 便捷性與管理復雜度的雙重提升
相較以太網(wǎng),WLAN在提升便捷性的同時(shí),其傳輸介質(zhì)發(fā)生了明顯的變化,從現在幾乎絕對可信的銅纜和光纖變?yōu)榻^對不可信的頻譜資源,因此,管理無(wú)線(xiàn)網(wǎng)絡(luò )的網(wǎng)管人員除必須擁有管理以太網(wǎng)絡(luò )必備的充足TCP/IP知識外,還必須理解無(wú)線(xiàn)網(wǎng)絡(luò )中的射頻知識,例如對信噪比、信號強度、發(fā)射功率、天線(xiàn)增益、干擾等概念的真正理解,以及對802.11協(xié)議的獨特特性,例如重傳的概念的真正理解。管理無(wú)線(xiàn)網(wǎng)絡(luò )對網(wǎng)管員的知識體系提出了新的挑戰,并且對接入介質(zhì)的管理復雜度呈幾何級提升。
1.3 從管理“有”到管理“無(wú)”
傳統以太網(wǎng)是有線(xiàn)網(wǎng)絡(luò ),所有的連接是可見(jiàn)的,某個(gè)終端連接到具體哪個(gè)設備是明確的。而無(wú)線(xiàn)網(wǎng)絡(luò )的連接是不可見(jiàn)的,某個(gè)終端在整個(gè)的接入過(guò)程中會(huì )不斷的發(fā)生切換,從一個(gè)接入設備切換到另外一個(gè)接入設備。在某些極端情況下,設備會(huì )在兩個(gè)不同的接入AP之間一分鐘之內切換幾十甚至上百次,并且這種切換完全由客戶(hù)端決定,傳統網(wǎng)管軟件的刷新速率已經(jīng)完全無(wú)法把握這種情況,這無(wú)疑成為如何進(jìn)行無(wú)線(xiàn)網(wǎng)絡(luò )管理所需解決的又一個(gè)重點(diǎn)問(wèn)題。
二、摩托羅拉系統將無(wú)線(xiàn)故障排查可視化
2.1 無(wú)線(xiàn)網(wǎng)絡(luò )拓撲的可視化
不一樣的無(wú)線(xiàn)網(wǎng)絡(luò )拓撲。當討論有線(xiàn)網(wǎng)絡(luò )拓撲圖時(shí),我們只需將客戶(hù)端簡(jiǎn)單地連接到接入交換機的物理接口即可。但是在無(wú)線(xiàn)里同一個(gè)AP還需要討論其ESS/BSS的問(wèn)題,因此拓撲圖應該是客戶(hù)端接入了哪一個(gè)BSS,然后這個(gè)BSS接入到哪一個(gè)ESS。所以,無(wú)線(xiàn)網(wǎng)絡(luò )的拓撲圖與有線(xiàn)網(wǎng)絡(luò )的拓撲圖是完全不同的。
2.2 不同的物理狀態(tài)
在無(wú)線(xiàn)領(lǐng)域中,沒(méi)有明確的線(xiàn)纜連接,只有無(wú)線(xiàn)區域的覆蓋好壞,而且無(wú)線(xiàn)網(wǎng)絡(luò )的動(dòng)態(tài)特征導致這種覆蓋好壞是變化的。因此,我們需要實(shí)時(shí)熱圖來(lái)監控整個(gè)無(wú)線(xiàn)網(wǎng)絡(luò ),使其真正的可視起來(lái)。
2.3 物理層排錯
在物理層排錯時(shí),大家普遍認為無(wú)線(xiàn)的干擾是網(wǎng)絡(luò )質(zhì)量的罪魁禍首。但是事實(shí)上,無(wú)線(xiàn)網(wǎng)絡(luò )中的資源利用率和干擾強度的組合才是真正的問(wèn)題所在,而且干擾不僅僅是WLAN對WLAN的干擾,還包括其它同頻干擾,例如微波、2.4GHz無(wú)線(xiàn)電遙控射頻信號或者藍牙信號。因此,在物理層排錯中,我們必須對所有的干擾源進(jìn)行分析,同時(shí)對其資源利用率進(jìn)行監控。僅僅通過(guò)網(wǎng)上某些免費的工具是不能夠真正定位問(wèn)題所在的。
舉一個(gè)簡(jiǎn)單的例子,大家隨便找兩個(gè)AP,將其設定在同一個(gè)信道上,然后把它們的發(fā)射功率調到最大,物理間隔僅10厘米。用傳統軟件看,這種干擾是極強的。但是如果有一個(gè)AP上有用戶(hù),另外一個(gè)AP上一個(gè)用戶(hù)都沒(méi)有,或者即使兩個(gè)AP都有用戶(hù),在A(yíng)P的競爭策略設定合理、用戶(hù)流量不大的情況下,我們的上網(wǎng)感知仍然會(huì )相當好。
相反,如果我們將兩個(gè)AP之間的距離拉遠到30米,每個(gè)AP上都接入用戶(hù),并且采用大流量,此時(shí),用傳統軟件看到的干擾會(huì )較小,但是實(shí)際的使用感知卻非常差。
還有一種情況,如果我們只使用一個(gè)AP,并讓幾個(gè)用戶(hù)同時(shí)接入,在用戶(hù)處在互相不可見(jiàn)的位置同時(shí)觀(guān)看高質(zhì)量視頻時(shí),所有用戶(hù)的感知都會(huì )很差。但在這種情況下,傳統軟件會(huì )認為這是沒(méi)有干擾的。
摩托羅拉系統選擇對整個(gè)無(wú)線(xiàn)網(wǎng)絡(luò )的整個(gè)物理層實(shí)現完整的呈現,包括各個(gè)信道的干擾強度、信道使用率以及是否有非WLAN的干擾。在下圖的示例中,信道11的干擾高達-25dBm,但是利用率只有5%,而信道1的干擾在-40到-50dBm之間,接口利用率卻高達100%,而且是持續的微波干擾。在這種情況下,信道1干擾小,但基本是不可使用的。信道11干擾極強,卻一定是客戶(hù)體驗最好的。因此,物理層可視化在無(wú)線(xiàn)網(wǎng)絡(luò )中是非常重要的。
2.3 您真的知道網(wǎng)絡(luò )的情況嗎?
在傳統以太網(wǎng)中,如果用戶(hù)出現玩游戲頻繁“卡”的情況,那么,查看一下互聯(lián)網(wǎng)出口的擁塞程度和用戶(hù)Ping DHCP服務(wù)器的響應時(shí)間,就基本可以定位問(wèn)題所在了。但是對于無(wú)線(xiàn)網(wǎng)絡(luò )而言,頻繁“卡”很有可能是無(wú)線(xiàn)和有線(xiàn)雙重因素導致。
如果是響應較慢,需要定位是無(wú)線(xiàn)慢還是有線(xiàn)慢;如果是無(wú)線(xiàn)慢,還要確認是哪種無(wú)線(xiàn)因素導致了緩慢。那么,到底是由于干擾、沖突、,無(wú)線(xiàn)網(wǎng)絡(luò )整體性能不足還是覆蓋不合理的頻繁漫游切換導致了這個(gè)問(wèn)題呢?
有些時(shí)候,由于無(wú)線(xiàn)網(wǎng)絡(luò )是共享式的,我們在無(wú)線(xiàn)中只要有一個(gè)或幾個(gè)用戶(hù)是低速率用戶(hù),整體網(wǎng)絡(luò )性能就會(huì )大幅度的下降。在20個(gè)終端中部分是802.11n AP的網(wǎng)絡(luò )(如18個(gè)802.11n加2個(gè)802.11b),其整體網(wǎng)絡(luò )性能可能遠遠低于20個(gè)均是802.11g的網(wǎng)卡。因此,如果一個(gè)用戶(hù)玩游戲卡,很有可能是另外一個(gè)用戶(hù)的網(wǎng)卡速率低造成的。
另外,如何排查用戶(hù)在兩個(gè)AP間頻繁切換的問(wèn)題呢?如何排查用戶(hù)的性能是由于干擾造成的呢?對于無(wú)線(xiàn)網(wǎng)絡(luò )的排錯需要看一個(gè)信道、一個(gè)用戶(hù)、一個(gè)BSS的整體情況,而不是僅僅排查某個(gè)用戶(hù)。
摩托羅拉系統通過(guò)一個(gè)界面可以遠程的了解數據的信號噪聲比(干擾)、用戶(hù)的重傳(空口負載情況)、數據傳輸速率(是否有低速率用戶(hù)影響了整個(gè)網(wǎng)絡(luò )性能)、用戶(hù)的傳輸信道分配(是否用戶(hù)短時(shí)間內在兩個(gè)不同信道內發(fā)射,也就是在頻繁漫游),完全可視化地監控全部可能存在的故障。
如果網(wǎng)管人員不足、無(wú)法實(shí)時(shí)監控時(shí),摩托羅拉系統可以定義網(wǎng)絡(luò )質(zhì)量劣化的兩大重要指標——傳輸速率和重傳率的門(mén)限,對網(wǎng)絡(luò )進(jìn)行實(shí)時(shí)監控,一旦指標超越門(mén)限值即可通過(guò)告警了解到這一情況,并且通過(guò)對歷史數據的詳細分析確認網(wǎng)絡(luò )故障的具體原因。
例如從附圖中網(wǎng)管員了解過(guò)去24小時(shí)中的不同類(lèi)型報文比例,如果將這一趨勢分析放大到季度或者年度,我們又可以分析網(wǎng)絡(luò )趨勢,及時(shí)調整網(wǎng)絡(luò )以避免問(wèn)題的大規模爆發(fā)。
三、通過(guò)故障排查可視化確保網(wǎng)絡(luò )的真正可用性
網(wǎng)絡(luò )最后100米由WLAN接管是大勢所趨,應用的多終端協(xié)同化是大勢所趨,關(guān)鍵應用效率提升通過(guò)移動(dòng)應用方式實(shí)現也是大勢所趨。無(wú)線(xiàn)網(wǎng)絡(luò )技術(shù)倒退是實(shí)際情況,無(wú)線(xiàn)網(wǎng)絡(luò )的物理介質(zhì)脆弱是實(shí)際情況,無(wú)線(xiàn)網(wǎng)絡(luò )不可視也是實(shí)際情況。
要求無(wú)線(xiàn)網(wǎng)絡(luò )完全無(wú)故障是不現實(shí)的,在這樣的實(shí)際要求下,無(wú)線(xiàn)網(wǎng)絡(luò )故障排查的高效率是我們必須提供的,尤其是將關(guān)鍵應用部署于無(wú)線(xiàn)之上的機構。