Aufbau eines flexiblen optischen Netzwerks für KI-Rechenleistungscluster

Apr 08, 2026

Eine Nachricht hinterlassen

Physisch belastbares Routing basierend auf deterministischem Shuffle

Da KI-Cluster immer weiter skalieren und Rechenzentren immer schneller wachsen, hat sich die Netzwerkarchitektur natürlich über traditionelle Designs hinaus entwickelt. Leaf-Spine- und Dragonfly-Topologien werden zur Norm. Auf dem Papier sehen sie effizient und modern aus. In der Praxis sehen sich Betriebsteams jedoch häufig mit einer anderen Realität konfrontiert.-Was wirklich Probleme verursacht, ist nicht die Topologie selbst, sondern die schiere Menge an Patchkabeln. Sobald Sie mit Tausenden von Verbindungen zu tun haben, wird die Verwaltung schnell unhandlich. Und wenn ein einzelner Punkt ausfällt, kann dies zum Ausfall einer gesamten Verbindung führen. Ein solches Risiko ist schwer zu ignorieren.

 

Hier beginnt die Idee hinter Infinity Shuffle OXC Sinn zu ergeben. Anstatt dem herkömmlichen Punkt-zu-Punktmodell-zu folgen, bei dem ein einzelner Pfad alles transportiert-, werden Hochgeschwindigkeitskanäle-aufgeteilt und auf mehreren Spine-Pfaden auf der physischen Ebene verteilt. Vereinfacht ausgedrückt wird dadurch vermieden, dass alle Eier in einen Korb gelegt werden. Wenn ein Fehler auftritt, bricht das System nicht vollständig zusammen; Es wird lediglich mit einer leicht reduzierten Kapazität betrieben und die Dienste laufen weiter.

 

Nehmen Sie als Beispiel eine 1,6T-Verbindung. Es ist in acht unabhängige 200G-Kanäle unterteilt, die jeweils über einen anderen Pfad geleitet werden. Wenn ein Modul oder eine Glasfaser ausfällt, ist nur ein Bruchteil der Bandbreite -ungefähr 12,5 %-betroffen. Bei KI-Trainings-Workloads ist diese Art der Verschlechterung normalerweise beherrschbar. Eine leichte Verlangsamung ist einer völligen Unterbrechung weitaus vorzuziehen.

 

Aus betrieblicher Sicht verändert sich dadurch auch der Wartungsrhythmus. Defekte Komponenten erfordern keinen dringenden Eingriff über Nacht. Sie können während geplanter Wartungsfenster bearbeitet werden, was in großen Umgebungen weitaus nachhaltiger ist. Gleichzeitig vereinfacht die Reduzierung der optischen Module das Gesamtsystem und verbessert die Stabilität, anstatt es zu verkomplizieren. In vielerlei Hinsicht ähnelt dieser verteilte Ansatz eher der realen Ingenieurlogik als der theoretischen Perfektion.

 

Auf der physikalischen Ebene verwendet die Lösung ein vorkonfektioniertes Faser-Shuffle-Design mit hoher-Dichte, wodurch die Einfügungsdämpfung nur etwa 0,05 dB beträgt. Es wurde entwickelt, um 400G-, 800G- und 1,6T-Netzwerke mit ausreichendem optischen Budget zu unterstützen und gleichzeitig den Kanalversatz und die Isolierung gemäß den IEEE 802.3-Standards beizubehalten. Es ist nichts übermäßig Auffälliges daran-aber es ist praktisch, einheitlich und so konstruiert, dass es maßstabsgetreu standhält.

 

Vier Kerndimensionen, die für Hyperscale-KI-Anforderungen entwickelt wurden

1. Nahtlose Ökosystemintegration und flexible Bereitstellungstopologien

640 640 1

Der Infinity Shuffle OXC lässt sich direkt in Verteilerrahmen der GPX-Serie (GPX51, GPX58, GPX59, GPX61, GPX62, GPX70) integrieren, ohne dass Adapterboxen von Drittanbietern erforderlich sind. Es unterstützt nativ MPO/MTP®-, MMC-, SN-MT-Anschlüsse sowie direkte Bare-Fiber-Konnektivität.

Es stehen zwei Bereitstellungstopologien zur Verfügung:

Inline-Shuffle: Spine-Verbindungen kommen von der Rückseite her (normalerweise ausgerichtet an den oberen-von-Rack-Spine-Schaltern), während Leaf-Verbindungen von vorne austreten. Diese Konfiguration unterstützt sowohl modulare Kassettendesigns als auch vollständige 1RU/2RU-Panelformate. Es ermöglicht eine klare Warm-/Kaltgang-Trennung und sorgt für eine deterministische Kabelführung von hinten-nach-vorne.

Side-by-Side Shuffle: Alle Spine-Switch-Anschlüsse sind auf der linken Seite des Gehäuses oder Panels zusammengefasst, während die Leaf-Switch-Anschlüsse auf der rechten Seite austreten. Dieses Layout eignet sich besonders für zentralisierte Glasfaserverteiler (FDFs), bei denen die horizontale Kabelführung zwischen Spine- und Leaf-Zonen minimiert werden muss.

Beide Topologien unterstützen serielle Verbindungen mit rückseitigem Zugriff und parallele Verbindungen mit frontseitigem Zugriff, wodurch die Raumausnutzung im Rack erheblich verbessert und die Anpassung an verschiedene Verkabelungsarchitekturen von Rechenzentren ermöglicht wird.

 

2. Kostenoptimierung und Risikominderung

Aus wirtschaftlicher Sicht reduziert die Integration auf 400G-, 800G- und 1,6T-Ebene die Anzahl der erforderlichen Switches von 24 auf 8 und der optischen Module von 1280 auf 320. Dies senkt direkt den Stromverbrauch und die Investitionsausgaben, wobei die Gesamtkosteneinsparungen bis zu 40 % betragen.

Unter dem Gesichtspunkt des Risikos führen herkömmliche gebündelte Glasfasersysteme zu einzelnen Fehlerquellen.-Beispielsweise kann eine Beschädigung eines einzelnen MPO-16-Trunks sofort zum Verlust einer vollständigen 1,6-T-Verbindung führen. Im Gegensatz dazu verteilt die Shuffle-Architektur die gleiche 1,6T-Kapazität auf acht unabhängige physische Pfade. Statistisch gesehen beschränken sich Ausfälle auf einzelne Kanäle, wodurch die Auswirkungen auf 1/8 der Gesamtbandbreite begrenzt werden. KI-Trainingscluster können weiterhin mit einer Kapazität von ca. 87,5 % arbeiten und gleichzeitig die RDMA-Konnektivität aufrechterhalten, wodurch groß angelegte Netzwerkrekonvergenzereignisse vermieden werden.

 

3. Industrielle-Präzisionsfertigung

Jede OXC-Einheit wird auf automatisierten Fertigungslinien hergestellt, die Substratschneiden (±0,5 mm), bionische Faserführung (±0,1 mm) und Präzisionsdosierung (±0,5 mm) umfassen.

Das bionische Routing-Design sorgt für eine strikte physikalische Kanalisolierung{0}}und verhindert Übersprechen zwischen den acht 200G-Kanälen innerhalb einer 1,6-T-Verbindung-bei gleichzeitiger Beibehaltung gleicher Faserlängen zur Vermeidung von Signalverzerrungen. Alle Einheiten werden vor der Auslieferung einer umfassenden optischen Validierung unterzogen, wodurch das Risiko von Feldterminierungsfehlern und Kanalungleichgewichtsproblemen im Zusammenhang mit der Hochgeschwindigkeits-PAM4-Signalisierung ausgeschlossen werden.

 

4. Einhaltung internationaler Standards

Der Infinity Shuffle OXC entspricht den wichtigsten internationalen Standards, darunter Telcordia GR-63, GR-1435 (MPO), IEC 61300, IEC 61753-1 und IEC 61754-7 / TIA-604-5.

Der flexible optische Schaltkreis nutzt ein Polyimidfilmsubstrat mit konformer Schutzbeschichtung und unterstützt maximale Abmessungen von bis zu 1000 mm × 800 mm. Ein einschichtiges Design kann mehr als 1.200 Glasfaserkerne aufnehmen und erfüllt so die Dichteanforderungen von Hyperscale-Bereitstellungen.

 

5. Mehrkanal-Signalintegrität

Das Substrat unterstützt 250-μm-Bandfasern, 200-μm-Single-Mode-Fasern (G657.A1/A2) und 180-μm-Fasern der nächsten Generation.

Die optische Leistung wird streng kontrolliert, mit einer typischen Einfügungsdämpfung von weniger als oder gleich 0,12 dB (hochwertiges UPC/APC), einer 97 % zufälligen Übereinstimmung von weniger als oder gleich 0,25 dB und einer Rückflussdämpfung von mehr als oder gleich 65 dB (APC) und mehr als oder gleich 60 dB (UPC). Dies gewährleistet eine gleichmäßige Verlustverteilung über alle acht Kanäle in einer 1,6-T-Verbindung, erfüllt die KP4-FEC-Kalibrierungsanforderungen und sorgt für eine skalierbare Energieeffizienz.

Sie haben nicht mehr genügend Humanizer-Wörter übrig. Aktualisieren Sie Ihren Surfer-Plan.

 

Präzise abgestimmt auf drei Kernanwendungsszenarien

640

1. Optimierung der Leaf-Spine mit verbesserter Spine-Zuverlässigkeit

In KI-Trainingsclustern ermöglicht der Infinity Shuffle OXC deterministisches Cross-Routing zwischen Spine- und Leaf-Ebenen. Beim Einsatz in einer seriellen Inline-Shuffle-Konfiguration-Spine-Verbindungen kommen von hinten und Leaf-Verbindungen kommen von vorne heraus-erzeugt es eine saubere Warm-/Kaltgangstruktur und ein vorhersehbares Verkabelungslayout.

Dieses Design passt auf natürliche Weise zu schlanken Spine-Architekturen. Eine 1,6-T-Verbindung ist physisch auf acht Spine-Switches verteilt. Wenn ein Spine-Switch-zum Beispiel Spine Nr. 3 Wartung erfordert, wird nur ein einzelner 200G-Kanal (12,5 % der Gesamtbandbreite) über ECMP auf einen entsprechenden Pfad umgeleitet. Die verbleibende Kapazität läuft weiter, so dass die Schulungsarbeitslasten ohne Unterbrechung einen Durchsatz von etwa 1,4 T aufrechterhalten können. Die Wartung kann ohne Beeinträchtigung der Kerndienste durchgeführt werden.

 

2. Vereinfachung von Dragonfly-Topologien durch physikalische -Schichtenverteilung

In High-{0}Performance-Computing-Umgebungen (HPC) mit Zehntausenden von Knoten erfordern herkömmliche Dragonfly-Voll--Mesh-Topologien eine komplexe gruppeninterne Verkabelung. Mit dem Infinity Shuffle OXC wird das optische Mischen zwischen Gruppen auf Fabrikebene durchgeführt, wodurch die Komplexität vor Ort erheblich reduziert wird.

Beim Einsatz in einem zentralisierten Glasfaserverteiler mit paralleler Shuffle-Topologie werden Spine-Verbindungen auf der linken Seite konsolidiert, während Leaf-Verbindungen von der rechten Seite geroutet werden. Dadurch entsteht eine klare physische Trennung zwischen den Netzwerkschichten. Durch deterministisches Routing wird sichergestellt, dass innerhalb einer einzelnen 1,6-T-Verbindung alle acht 200G-Kanäle unabhängigen physischen Pfaden -über verschiedene Switches, Fasern und Anschlüsse- folgen, wodurch die mit gebündelten Trunk-Verbindungen verbundenen Ausfallrisiken effektiv beseitigt werden.

 

3. Zukunft-Bereit für 800G und mehr

Da sich die Netzwerkbandbreite in Richtung 1,6T und 3,2T (8 × 200G oder 8 × 400G) entwickelt, wird der Ausfallsicherheitswert von Shuffle-Architekturen noch deutlicher. Bei einer 3,2T-Bereitstellung, die über Spine-Switches (16 × 200G) verteilt ist, führt ein Ausfall eines einzelnen Kanals nur zu einer Bandbreitenreduzierung von 6,25 %.

Sobald die optische Shuffle-Infrastruktur bereitgestellt ist, erfordern zukünftige Upgrades nur den Austausch des optischen Moduls, ohne Änderungen an der physikalischen Schicht. Das Substrat unterstützt nativ ultrafeine 180-μm-Fasern der nächsten-Generation und gewährleistet so die Kompatibilität mit zukünftigen rein{4}optischen Technologien. Da die Datenraten pro Kanal-zusammen mit dem Stromverbrauch und der Ausfallwahrscheinlichkeit steigen-, bietet diese Architektur eine stabile Grundlage, die das mit 800G und darüber hinaus verbundene höhere Risiko effektiv absorbiert und gleichzeitig einen unterbrechungsfreien Dienst aufrechterhält.

 

Von der manuellen Komplexität zur deterministischen Zuverlässigkeit

Beim Konzept „Shuffle“ geht es nicht um Zufälligkeit. Es handelt sich um eine deterministische Verteilung von Hochgeschwindigkeitskanälen über physikalisch unabhängige Spine-Verbindungen. Herkömmliche Abläufe basieren auf der manuellen Verwaltung Tausender Glasfaserverbindungen-ein Ansatz, der sowohl ineffizient als auch fehleranfällig ist-. Im Gegensatz dazu strukturiert diese Architektur die Konnektivität auf der physischen Ebene neu und verbessert so sowohl die Betriebsklarheit als auch die Systemzuverlässigkeit.

Durch die gleichmäßige Verteilung von acht 200G-Kanälen auf acht Spine-Switches stellt das System sicher, dass Ausfälle{{1}ob in optischen Modulen, Fasern oder Switches-einzelne Ereignisse und keine systemischen Ausfälle bleiben. Dies verhindert grundsätzlich großflächige-Störungen in KI-gesteuerten optischen Netzwerken-.

 

Ganz gleich, ob Sie Leaf-Spine-Architekturen mit einer schlankeren Spine-Schicht optimieren, Dragonfly-Bereitstellungen durch strukturierte Verkabelung vereinfachen oder sich auf eine zukünftige Skalierung von 1,6T/3,2T mit integrierter-Fehlertoleranz vorbereiten, der Infinity Shuffle OXC bietet eine hohe-Effizienz, hohe-Zuverlässigkeit und kostengünstige -effektive Verkabelungsgrundlage für Hyperscale-Rechenzentren-, die diese Rechenleistung gewährleistet Arbeitsbelastungen bleiben durch Einschränkungen der optischen Infrastruktur ununterbrochen.

 

Anfrage senden