互聯網技術詳解 | 高速以太網技術
以太網是目前應用最爲普遍的局域網技術,從1983年(nián)IEEE 802.3标準誕生(shēng)後的幾十年(nián)時間裏,以太網速率從10M、100M慢(màn)慢(màn)發展到了GE、10GE以及100GE/400GE。目前在數據中心内部服務器還是以10GE、25GE網卡爲主,網絡架構相(xiàng)對應也主要是10GE-40GE、25GE-100GE的互連模型。随着業務的不斷升級,帶寬需求越來越大(dà),25GE服務器已經難以滿足業務發展,因此後續DCN将逐漸進入50GE接入以及100GE接入時代。本文我們将一起探索50G/200G/400G高速以太網技術,主要爲大(dà)家介紹标準協議技術發展以及光(guāng)模塊的發展。
一、50G PAM4調制技術
以太網技術發展到100G時,物理(lǐ)層調制碼型還主要是NRZ技術,但(dàn)是100G之後這種調制方式面臨着帶寬提升帶來成本激增以及調制方案充分(fēn)度不足的問題。因此在IEEE P802.3bs工(gōng)作(zuò)組制定400G标準時有廠家提出用PAM4替代NRZ,随之獲得(de)通過。之後的200GE/50GE标準也采用了該調制技術,因此可(kě)以說本文談到的三個以太網标準均基于PAM4技術。
接下來我們來看(kàn)一下PAM4技術對比NRZ技術在哪些地方做了改進:
圖1 NRZ與PAM4信号波形對比
如(rú)圖1所示,波形圖的主要參數有兩個:比特周期T和幅度H。信号傳輸所需帶寬與比特周期相(xiàng)關,比特周期越短(duǎn),所需帶寬就(jiù)越大(dà)。另外就(jiù)是信噪比(SNR),信噪比與振幅相(xiàng)關,振幅越小,噪聲敏感性越大(dà)。
NRZ信号分(fēn)别用高、低兩種電平信号表示1、0兩種數字邏輯信号。我們把NRZ的比特周期看(kàn)做一個完整的T,其幅度看(kàn)做一個完整的H。
再來看(kàn)PAM4的信号波形,PAM4信号用四種電平信号表示00、01、10以及11四種數字邏輯信号。PAM4中“PAM”指的是脈沖幅度調制,“4”表示4級脈沖調制。顧名思義,PAM4對比NRZ其比特周期是一緻的,但(dàn)是在幅度層面每個電平信号的幅度變成了H/3。
以上就(jiù)是兩種技術的主要區别,其實簡單來理(lǐ)解就(jiù)是NRZ信号每個時鍾周期可(kě)以傳輸1bit的邏輯信息,PAM4信号每個時鍾周期可(kě)以傳輸2bit的邏輯信息。因此,在同樣波特率條件(jiàn)下,PAM4信号傳輸效率是NRZ信号的兩倍,同時還可(kě)以有效降低成本,以上這些優勢卻僅僅以犧牲噪聲敏感性作(zuò)爲代價。所以,基于單通道50G PAM4技術的400GE/200GE/50GE可(kě)以很好得(de)适應業務發展需求。
二、50GE以太網技術
50GE的相(xiàng)關标準是由IEEE P802.3cd工(gōng)作(zuò)組制定的,于2016年(nián)5月正式啓動,其标準基線完成于2016年(nián)9月。IEEE 802.3cd标準覆蓋了50GBASE-LR/KR/SR/FR PMD子層,所有子層均采用了
圖2 50GBASE-LR架構
我們先對上圖所示架構中的一些主要組成部分(fēn)做一個簡單介紹:
PCS子層負責對信号編/解碼、加/去(qù)擾、Alignment插入/去(qù)除、排序處理(lǐ)和控制等,PCS子層還具備FEC(前向糾錯)的功能。
PMD子層負責和物理(lǐ)傳輸媒介的接口,一個以太網速率存在多個不同的PMD子層,分(fēn)别适配不同的物理(lǐ)接口。
PMA子層負責适配PCS和PMD子層,提供映射、複用解複用、時鍾恢複等功能。
MDI代表了物理(lǐ)媒介,比如(rú)光(guāng)纖、電纜等。
PMA子層将兩路(lù)26.5625Gbaud NRZ信号與一路(lù)26.5625Gbaud PAM-4信号進行雙向轉換。發送方向時,經過PMA完成速率和碼型轉換後的數據在PMD子層進行電光(guāng)轉換,由Transmitter發送到MDI。接收方向時,PMD子層從Receiver收到的數據并進行光(guāng)電轉換,然後發送給PMA進行速率和碼型轉換,以上就(jiù)是50GBASE-LR 架構解析。IEEE 802.3cd定義的50G标準有以下幾種:
50GBASE-CR,通過雙絞銅線屏蔽電纜的一個通道(2條同軸雙絞線)傳輸50 Gb / s,至少達到3 m;
50GBASE-FR,在一個波長(總共2根光(guāng)纖)上的50 Gb / s串行傳輸,可(kě)通過單模光(guāng)纖電纜進行操作(zuò),最大(dà)可(kě)達2 km;
50GBASE-KR,通過電背闆的一個通道傳輸50 Gb / s,在13.28125 GHz時總插入損耗小于30 dB;
50GBASE-LR,在一個波長(總共2根光(guāng)纖)上以50 Gb / s的速率進行串行傳輸,可(kě)通過單模光(guāng)纖電纜進行操作(zuò),并達到至少10 km;
50GBASE-SR,通過一個通道(總共2根光(guāng)纖)的50 Gb / s傳輸速率,可(kě)通過多模光(guāng)纖電纜進行操作(zuò),最大(dà)可(kě)達100 m。
以上就(jiù)是50G以太網技術的相(xiàng)關情況,50G技術是400G/200G以太網技術的基礎,所以本小節我們重點介紹了50GBASE标準的架構及組成。本小節主要想讓大(dà)家了解50G PAM-4技術是如(rú)何應用在50G以太網中的,了解清晰之後,我們接來下重點看(kàn)一下400G以太網技術以及400G光(guāng)模塊的發展情況。
三、400GE以太網技術
400GE标準基線是由IEEE P802.3bs工(gōng)作(zuò)組于2015年(nián)初制定的。随後,400GE接口的多種PMD子層規格以及AUI電接口陸續提出來。
其中,IEEE 802.3bs定義了傳輸距離70-150m的SR16、傳輸距離爲500m的DR4、傳輸距離爲2km的FR8以及傳輸距離爲10km的LR8。IEEE 802.3cm定義了傳輸距離爲100m的SR8、SR4.2。100G Lambda MSA定義了傳輸距離爲2km的 FR4、傳輸距離爲10km的LR4。OIF定義了傳輸距離爲80km的ZR。這些規格裏邊隻有SR16仍采用NRZ的調制技術,其他(tā)規格均采用了PAM4調制。不同規格對應的電口、光(guāng)口速率如(rú)圖3所示。
圖3 400G接口的相(xiàng)關标準
01
100m傳輸距離主流标準是SR8:
SR8 400G光(guāng)模塊,該模塊光(guāng)口采用了26.5625 Gbaud PAM-4調制,所以單通道可(kě)以傳輸50G,8條通道傳輸400G。下圖是400G SR8光(guāng)模塊的内部通道圖示:
圖4 400G SR8傳輸通道
從圖4可(kě)以看(kàn)到:400G SR8光(guāng)模塊光(guāng)口采用16芯光(guāng)纖或者24芯光(guāng)纖的MPO連接器,光(guāng)纖傳輸通道均是8收8發,單通道50G,可(kě)以實現400G以太網速率在100m距離内的傳輸。
02
500m傳輸距離主流标準是DR4:
圖5 400G DR4光(guāng)模塊及通道
400G DR4光(guāng)模塊光(guāng)口采用了53.125 Gbaud PAM-4調制,單通道可(kě)以傳輸100G,4通道可(kě)以傳輸400G。從圖5的通道圖示來看(kàn),該模塊采用了12芯光(guāng)纖的MPO連接器,4收4發,單通道傳輸100G,可(kě)以實現400G以太網速率在500m距離内的傳輸。同時,也可(kě)以将400G一分(fēn)四爲4個100G,與4個100G模塊互連。在AWS的數據中心中,就(jiù)大(dà)量存在400GBASE-DR4一分(fēn)四的部署場景。
03
2km/10km傳輸距離主流标準是FR4/LR4:
圖6 400G FR4/LR4光(guāng)模塊及通道
400G FR4/LR4光(guāng)模塊光(guāng)口同樣采用了53.125 Gbaud PAM-4調制,單波道可(kě)以傳輸100G,4波道可(kě)以傳輸400G。從圖6的通道圖示來看(kàn),該模塊采用了LC連接器,通過波分(fēn)複用技術将4種不同波長的通道在一根光(guāng)纖中傳輸,這樣通過一收一發兩根光(guāng)纖便可(kě)以實現400G以太網速率在2km/10km距離内的傳輸。
四、200GE以太網技術
200G高速以太網技術在标準制定進度層面與400G極爲相(xiàng)近,同樣都(dōu)由IEEE P802.3bs工(gōng)作(zuò)組所主要覆蓋,同時個别标準例如(rú)200GBASE-CR4、200GBASE-SR4等由IEEE P802.3cd工(gōng)作(zuò)組制定。與此同時,在光(guāng)模塊架構上,200G光(guāng)模塊與400G光(guāng)模塊也極爲相(xiàng)似。200G目前主要的标準有200GBASE-SR4、200GBASE-DR4、200GBASE-FR4以及200GBASE-LR4,傳輸距離分(fēn)别爲100m、500m、2km以及10km。
200GBASE-SR4與400GBASE-SR8架構上類似,同樣采用了26.5625Gbaud PAM-4調制,唯一區别的地方在于200GBASE-SR4是4條通道,而400GBASE-SR8是8條通道,因此200GBASE-SR4光(guāng)模塊采用12芯的MPO連接器即可(kě)。
200GBASE-DR4與400GBASE-DR4通道圖示(見圖5)相(xiàng)似,隻不過200GBASE-DR4光(guāng)模塊采用了26.5625Gbaud PAM-4調制,這樣話單通道可(kě)以傳輸50G,4通道可(kě)以傳輸200G。同樣的,該模塊也采用了MPO連接器與光(guāng)纖互連。
200GBASE-FR4與400GBASE-FR8類似,均采用了26.5625Gbaud PAM-4調制,唯一不同的地方就(jiù)在于200G模塊是在一根光(guāng)纖中跑了4種不同波長的波道,而400G則是在一根光(guāng)纖中存在8個波道,傳輸距離可(kě)以達到2km。
同理(lǐ),200GBASE-LR4與400GBASE-LR8類似,也采用了26.5625Gbaud PAM-4調制,通過4種不同波長的波道在一根光(guāng)纖中傳輸,可(kě)以達到10km的傳輸距離。
目前200GBASE-FR4光(guāng)模塊在Google與Facebook的數據中心中都(dōu)有大(dà)規模部署。
五、不同類型光(guāng)模塊在DCN組網中的應用
現階段大(dà)型互聯網數據中心内部組網架構可(kě)以用下圖來表示,自(zì)下到上依次是Server層、TOR層、Leaf層、Spine層以及Core層,如(rú)下圖所示。
圖7 互聯網數據中心組網模型
後續随着IDC規模的增大(dà),互連網絡的以太網速率也會随之升級,我總結了不同網絡模型下各個層級的互連網絡所主要使用的光(guāng)模塊或線纜,見圖8。
圖8 不同組網模型下光(guāng)模塊使用情況
針對互聯網數據中心的組網模型發展,新華三始終放(fàng)眼未來,站(zhàn)在行業前端,爲互聯網客戶提供構建IDC組網所需的全套産品及方案。