Torus-Verbindung - Torus interconnect

Ein Torus- Interconnect ist eine schalterlose Netzwerktopologie zum Verbinden von Verarbeitungsknoten in einem parallelen Computersystem .

Diagramm eines dreidimensionalen Torus- Interconnects. Es ist nicht auf 8 Knoten beschränkt, sondern kann aus einer beliebigen Anzahl von Knoten in einer ähnlichen geradlinigen Anordnung bestehen.

Einführung

In der Geometrie wird ein Torus erzeugt, indem ein Kreis um eine zum Kreis koplanare Achse gedreht wird . Obwohl dies eine allgemeine Definition in der Geometrie ist, beschreiben die topologischen Eigenschaften dieser Art von Form die Netzwerktopologie in ihrer Essenz.

Geometrieabbildung

Die folgenden Bilder sind 1D- und 2D-Torus. 1D-Torus ist ein einfacher Kreis und 2D-Torus hat die Form eines Donuts. Die folgende Animation veranschaulicht, wie ein 2D-Torus aus einem Rechteck erzeugt wird, indem seine beiden gegenüberliegenden Kantenpaare verbunden werden. Hier wird der Begriff Torus verwendet, um im Wesentlichen den Anfang und das Ende einer Folge von Knoten zu beschreiben, die wie ein Donut verbunden sind. Um das Konzept besser zu veranschaulichen und zu verstehen, was die Topologie bei der Netzwerkverbindung bedeutet, geben wir 3 Beispiele für parallel verbundene Knoten mit Torus-Topologie. In einer Dimension entspricht eine Torustopologie einem Ringverbindungsnetzwerk in Form eines Kreises. Bei 2D entspricht es einem 2D-Netz, jedoch mit einer zusätzlichen Verbindung an den Kantenknoten, was die Definition von 2D-Torus ist.

Torus-Netzwerktopologie

Wir können die Regel aus den obigen Abbildungen verallgemeinern. Torus-Interconnect ist eine schalterlose Topologie, die als Mesh-Interconnect mit Knoten in einer geradlinigen Anordnung von N = 2, 3 oder mehr Dimensionen mit Prozessoren, die mit ihren nächsten Nachbarn verbunden sind , und entsprechenden Prozessoren an gegenüberliegenden Kanten des Array verbunden. [1] In diesem Gitter hat jeder Knoten 2N Verbindungen. Diese Topologie erhielt ihren Namen dadurch, dass das so gebildete Gitter topologisch homogen zu einem N-dimensionalen Torus ist .

Visualisierung

Die ersten 3 Dimensionen der Torus-Netzwerktopologie sind einfacher zu visualisieren und werden im Folgenden beschrieben:

  • 1D Torus: Es ist eine Dimension, n Knoten sind in einer geschlossenen Schleife verbunden, wobei jeder Knoten mit seinen 2 nächsten Nachbarn verbunden ist. Die Kommunikation kann in 2 Richtungen erfolgen, +x und −x. 1D-Torus entspricht der Ringverbindung .
  • 2D Torus: Es ist zweidimensional mit Grad 4, die Knoten werden in einem zweidimensionalen rechteckigen Gitter von n Zeilen und n Spalten dargestellt, wobei jeder Knoten mit seinen 4 nächsten Nachbarn verbunden ist und entsprechende Knoten an gegenüberliegenden Kanten verbunden sind. Die Verbindung gegenüberliegender Kanten kann visualisiert werden, indem die rechteckige Anordnung zu einer "Röhre" gerollt wird, um zwei gegenüberliegende Kanten zu verbinden, und dann die "Röhre" zu einem Torus gebogen wird, um die anderen beiden zu verbinden. Die Kommunikation kann in 4 Richtungen erfolgen, +x, −x, +y und −y. Die Gesamtzahl der Knoten von 2D-Torus ist n 2
  • 3D Torus: Es ist dreidimensional, die Knoten werden in einem dreidimensionalen Gitter in Form eines rechteckigen Prismas vorgestellt, wobei jeder Knoten mit seinen 6 Nachbarn verbunden ist, wobei die entsprechenden Knoten auf gegenüberliegenden Seiten des Arrays verbunden sind. Jede Kante besteht aus n Knoten. die Kommunikation kann in 6 Richtungen erfolgen, +x, –x, +y, –y, +z, –z. Jede Kante des 3D-Torus besteht aus n Knoten. Die Gesamtzahl der Knoten von 3D-Torus ist n 3
  • ND Torus: er kann N Dimension haben, jeder Knoten des N Dimension Torus hat 2N Nachbarn, Kommunikation kann in 2N Richtungen stattfinden. Jede Kante besteht aus n Knoten. Die Gesamtzahl der Knoten dieses Torus ist n N . Die Hauptmotivation für eine höhere Torus-Dimension besteht darin, eine höhere Bandbreite, eine geringere Latenz und eine höhere Skalierbarkeit zu erreichen.

Höherdimensionale Arrays sind schwer zu visualisieren, aber wir können aus der obigen Regel sehen, dass jede höhere Dimension jedem Knoten ein weiteres Paar nächster Nachbarverbindungen hinzufügt.

Leistung

Eine Reihe von Supercomputern auf der TOP500- Liste verwenden dreidimensionale Torus-Netzwerke, zB Blue Gene/L und Blue Gene/P von IBM sowie der Cray XT3. Blue Gene/Q von IBM verwendet ein fünfdimensionales Torus-Netzwerk. Fujitsus K-Computer und der PRIMEHPC FX10 verwenden eine proprietäre dreidimensionale Torus-3D-Mesh-Verbindung namens Tofu.

3D Torus-Leistungssimulation

Sandeep Palur und Dr. Ioan Raicu vom Illinois Institute of Technology führten Experimente durch, um die 3D-Torusleistung zu simulieren. Ihre Experimente liefen auf einem Computer mit 250 GB RAM, 48 Kernen und x86_64-Architektur. Der von ihnen verwendete Simulator war ROSS ( Rensselaer's Optimistic Simulation System ). Sie konzentrierten sich hauptsächlich auf drei Aspekte: 1. Variierende Netzwerkgröße 2. Variierende Anzahl von Servern 3. Variierende Nachrichtengröße. Sie kamen zu dem Schluss, dass der Durchsatz mit zunehmender Server- und Netzwerkgröße abnimmt. Andernfalls steigt der Durchsatz mit zunehmender Nachrichtengröße.

6D Torus-Produktleistung

Fujitsu Limited hat ein 6D-Torus-Computermodell namens "Tofu" entwickelt. In ihrem Modell kann ein 6D-Torus eine Off-Chip-Bandbreite von 100 GB/s, eine 12-mal höhere Skalierbarkeit als ein 3D-Torus und eine hohe Fehlertoleranz erreichen. Das Modell wird im K-Computer und in Fugaku verwendet .

Vorteile und Nachteile

Vorteile

Höhere Geschwindigkeit, geringere Latenz
Aufgrund der Verbindung gegenüberliegender Kanten haben Daten mehr Möglichkeiten, von einem Knoten zum anderen zu gelangen, was die Geschwindigkeit stark erhöht.
Bessere Fairness
In einem 4×4-Mesh-Interconnect ist der längste Abstand zwischen den Knoten von der oberen linken Ecke zur unteren rechten Ecke. Jedes Datum benötigt 6 Sprünge, um den längsten Weg zurückzulegen. Aber in einer 4×4 Torus-Verbindung kann die obere linke Ecke mit nur 2 Hops zur unteren rechten Ecke wandern
Geringerer Energieverbrauch
Da Daten tendenziell weniger Hops zurücklegen, ist der Energieverbrauch tendenziell geringer.

Nachteile

Komplexität der Verkabelung
Zusätzliche Drähte können den Routing-Prozess in der physischen Entwurfsphase erschweren. Wenn wir mehr Drähte auf dem Chip verlegen möchten, müssen wir wahrscheinlich die Anzahl der Metallschichten erhöhen oder die Dichte auf dem Chip verringern, was teurer ist. Andernfalls können die Drähte, die gegenüberliegende Kanten verbinden, viel länger sein als andere Drähte. Diese Ungleichheit der Verbindungslängen kann aufgrund der RC-Verzögerung zu Problemen führen .
Kosten
Während lange Wrap-Around-Links die einfachste Möglichkeit zur Visualisierung der Verbindungstopologie darstellen können, machen Beschränkungen der Kabellängen in der Praxis lange Wrap-Around-Links oft unpraktisch. Stattdessen werden direkt verbundene Knoten – einschließlich Knoten, die die obige Visualisierung an gegenüberliegenden Kanten eines Gitters platziert, die durch eine lange umlaufende Verbindung verbunden sind – physisch in einem gefalteten Torus-Netzwerk physisch fast nebeneinander platziert. Jeder Link im gefalteten Torus-Netzwerk ist sehr kurz – fast so kurz wie die Next-Neighbor-Links in einer einfachen Grid-Verbindung – und hat daher eine geringe Latenz.

Siehe auch

Verweise