99日本精品-天海翼久久久中文字幕乱码-欧美日韩精品一区二区在线播放,四方影院av,100部高清毛片免费观看,chiansea老熟老妇3乱

入選全球頂級會議SIGCOMM,恒為科技首次公開OCS光交換機相關成果

發布日期:2025-07-24

近日,香港科技大學智能網絡與系統實驗室(iSING Lab)的論文MixNet被國際通信網絡領域頂級會議SIGCOMM 2025[1]接收,恒為科技作為研究團隊成員之一,與麻省理工大學、北京大學、廈門大學、Meta一起提出了一種面向混合專家模型訓練的光電混合可重構網絡架構,用區域性動態拓撲打破靜態網絡的性能與成本瓶頸。

圖為“論文標題及作者”


[1]SIGCOMM,Special Interest Group on Data Communication,即數據通信專業組,是ACM組織在通信網絡領域歷史最為悠久也最為權威的學術會議之一。


今年的第39屆SIGCOMM 2025 將于9 月8日-11日在葡萄牙科英布拉舉行。屆時,恒為科技將公布更詳細的OCS光交換產品系統方案細節。


隨著生成式AI模型規模不斷擴大,Mixture-of Experts(MoE)架構因其激活稀疏性而成為主流方案。MoE模型訓練中產生的大量專家并行(EP)通信具有稀疏性、區域性和動態性,而傳統靜態網絡拓撲難以高效承載這一模式下的all-to-all通信。


MixNet提出一種從第一性原理出發設計的光電混合、運行時可重構的互聯架構,專為大規模MoE訓練打造,核心創新包括:


  • 區域性光路互聯 + 全局數據包交換網絡:基于訓練通信測量與結構性分析,MixNet使用區域OCS(Optical Circuit Switch)按需連接處于同一專家組的GPU,極大降低光端口需求與硬件成本;同時,所有節點通過電交換網絡(EPS)實現全局互聯,確保靈活性與可達性。該光電混合架構兼具 OCS的高帶寬與EPS的可擴展性,可支持至萬卡甚至十萬卡規模。


  • 訓練中動態拓撲重配置:根據每輪訓練中活躍專家對的通信需求,MixNet在all-to-all通信前按需重配置光路,精準匹配流量拓撲,提升通信效率、減少資源浪費。


  • 支持GPU/NIC故障恢復與訓練連續性:MixNet結合OCS和EPS備份路徑與區域重映射機制,支持單 GPU、單NIC故障容忍與整節點故障恢復,保障大規模分布式訓練的可靠性。


研究團隊在真實系統(32端口毫秒級OCS光交換機 + 32×A100 GPU)上完成了MixNet的原型驗證,并使用大規模數據包級仿真對其進行了系統評估。結果顯示,MixNet可逼近理想Fat-tree / Rail-optimized網絡性能,同時將網絡部分的性價比提升2.5倍。


MixNet成功入選SIGCOMM 2025,是恒為科技在智能算力網絡核心技術領域持續投入研究的有力證明,彰顯了公司通過協同創新解決產業關鍵難題的能力,為未來智能算力網絡的建設注入新動能。



恒為科技作為國內領先的網絡可視化、智能系統平臺、智算方案和服務提供商,近年來持續積極探索大規模智算場景下的高性能網絡技術與架構創新;在MixNet近一年的研究過程中,公司積極跟進國內外OCS光交換的產業化進展以及相關的CPO、LPO光模塊和先進硅光互聯技術研究,并與智算中心應用場景深度結合,攜手業界領先的光器件廠家,快速推進OCS與光電混合組網的商業化落地。


當前光電路交換技術和應用場景 - 來源:CignalAI 2025Q1


后續,恒為科技將陸續推出多款OCS光交換產品,涵蓋不同切換時延指標和端口規模的光交換設備,能有效滿足算力集群持續演進的全光交換場景需求。結合本次MixNet的研究成果,為大規模MoE訓練和新型智算超節點的高效能組網開辟了全新技術路徑。


上一篇:【WAIC 2025】恒為科技聯合沐曦發布靜音液冷AI一體機,讓大模型告別“咆哮式”計算 下一篇:嚴正聲明 | 警惕招聘騙局,謹防上當受騙