人工智能(AI)和機器學習(ML)技術的蓬勃發展,對于高性能計算(HPC)和大規模數據處理的需求不斷攀升。當前GPU互聯端口已迅速升級至800G(2x400G),并預計下一代將演進到1.6T(2x800G),使得數據中心對光互聯的帶寬需求愈發緊迫。
Al/ML集群互聯
HPC和數據中心互聯面臨新挑戰
?
隨著AI/ML集群規模的迅速增長,從幾百張加速卡擴展至上萬張,集群互聯距離也從數十米延伸至上百米。這導致對低功耗和低延遲的需求變得尤為緊迫,而傳統的電子交換面臨著瓶頸。同時,HPC也面臨著更高的要求,包括集群規模的靈活配置和網絡的長期穩定運行。大規模數據中心互聯也面臨Spine交換機性能瓶頸和端口速率演進的挑戰,隨著速率提升,200G及以上速率單純依賴硬件升級能效提升不明顯,需要通過架構重構等方式進一步提升能效,降低運營成本。
支持軟件定義網絡(SDN)
全光交換方案應運而生
為解決這些挑戰,全光交換(OCS)方案應運而生。OCS通過其全光交換的優勢,實現光信號的透明傳輸、支持光纖中任意速率/調制格式/通信波長光信號的交換,并具有無時鐘抖動、無延遲、不讀取數據、無泄漏風險等特點。此外,OCS還支持軟件定義網絡(SDN)使能控制,提高了系統的靈活性。
OCS全光交換方案已成功應用于一些數據中心,就在去年12月6日Google推出的人工智能模型Gemini,其配套硬件TPUv5版本,加強了OCS光交換技術的應用。在Google TPUv4的應用中,OCS顯著提升了集群互聯的可靠性,即使在主機可靠性下降到99.0%的情況下,仍能保證TPU切片有出色的性能,系統整體性能提升超過6倍以上。
AI算力“軍備競賽”
OCS解決方案應用廣闊
軟件定義全光交換通過其在高性能計算和數據中心應用中的性能,為AI網絡的發展提供了重要支持。隨著數據中心的演進,OCS全光交換技術將在光互聯領域展現更為廣泛的應用前景,為數字化轉型的成功注入新的活力。AIGC大模型時代必然導致算力軍備競賽,推動算力芯片和網絡升級,有望促進行業長期增長。
智算數據中心對光互聯的帶寬需求越來越高,隨著集群規模的擴大,將需要更大的端口OCS,同時需提升OCS可靠性和插回損性能。而基于DirectLight直接光束偏轉技術的OCS解決方案,具有超低損耗和回損,高抗震性等優異性能,在運營成本、吞吐量、功耗和成本方面都取得重大收益?;贒irectLight的OCS方案可以輕松實現可靠的遠程選擇性路由、在線性能監控和自動保護等,除了智算中心應用,在互聯網,互聯網等方向也有廣泛應用,OCS將成為6G時代空天地一體化網絡重要組成部分。
凌云光大矩陣全光交換解決方案
凌云光自2001年起即關注光交換技術、產品與應用的推廣,2015年正式與全球光交換廠家H+S Polatis公司建立戰略合作伙伴關系,共同開創光交換應用的新時代。H+S Polatis 提供低損耗的全光交換解決方案,用于遠程光纖層配置、保護、監控、重新配置和測試。
H+S Polatis 6000/7000系列全光交換機性能,支持完全無阻塞8×8~576×576矩陣規模,具有較好的抗震性,支持宇航級應用。超低插回損,光學指標優異,支持單路雙向傳輸和暗光纖交換,全光透明傳輸,與速率/協議無關,支持400G/800G及以上速率平滑升級,可選N×N對稱以及任意端口配置結構(CC系列),滿足SDN應用??梢詮V泛的應用在AI智算中心全光交換、互聯網、互聯網和產線自動化測試等應用場景。