close
close

Ki-Netze Ohne Engpässe: Arista überarbeitet Lastvertilung und monitoring

Ki-Netze Ohne Engpässe: Arista überarbeitet Lastvertilung und monitoring

Der Netzwerkausrüster für Rechenzentren arista Networks Hat Sein Netzwerkequipment und das dazugehörige monitoring für ki-workloads überarbeitet. ES UMFASST NUN EIN CLUSTER LOCANCAREA LOAD (CLB), DAS DID DATENSTRöme Gleichmäßig Verteilen SOLL. Zudem Soll Das überwachungstool Cloudvision Observability of the Universal Network (CV UNO) eine Ende-Zu-Sichtbarkeit im Ki-Netzwerk Erzeugen und Sine agnostik für die zugehörigen butterfly wave ptenziellen Fehlerbill Ermöglichen.

Ki-Clus Erzeugen im Netzwerk für das ki-training meist wenige data, die jedoch über eine hohe bandite verfügen. Herkömmliche Methoden Zur Lastvertilung, Die Rein auf der Ebene der Netzwerk-Header ageren, Sind Für Ki-Workloads Daher Undffia Ving Führen Zu Einer UNGLEICHMäigen Verteilung des Traffic. Außerdem Entstehen teilweise erhöhte latenzen undsaverluste, die den absschluss der aufgaben verzögern.

CLB SOLL DIESE ZEIT DUCH EINE AGNOSTIK Für den Datenverkehr des Direct memory access (RDMA) Reduzieren. EBENSO WIRKT DAS CLB AUF DAS KOMMUNIKATVERHALTE DER KI-TRANS-TRANS-TRANSPORTSOFTWARE über Die Receneinheit Mit Deren Dedizier Netzwerk. Konkret Arbeitet Die Lastvertilung Mit Dem Bidirektional Datenfluss in the spine-leaf-arhitektur einer, also, sowohl von spine zu leaves, als auch in die gegenrichtung. Dort SOLL DAS CLB Relevant Erkennen flows, eine gleichmäßiig verteilung aller Datenströme gewährlesti und gleichzeig die latenz gering haten.

Jeder Rdma-endpunkt, Etwa ein server in einem ki-inclus, besitzt mindestens ein Warteschlangenpaar, Die Mit einem remote tail, auf einem Anderen Server Kommunizart. Ein solches paar besteht aus einer sergete- und einer emphangswarteschlange und kann ohne beteiligung der cpu firekt auf den Speicer Zugreifen. So Lassen sich Latenzen Reduzieren. Unternehmensangaben zufolge Habe der kunde oracle aufgrund der überarbeiteten lastverteilungin problem mit kollidierenden datnströmen vermieden und denchsatz in cars-learning -netwerken.

MIT seiner überwachungsplattform cv uno will arista seinen Kunden Einen UMFassenden Blick auf Ki-Netze Ermöglichen. Nutzer Können über das neue monitoring den looking von ki-jobs einsehen. Dazu Zählen Auch Job-confestellungszeiten, Puffer-/Link-Auslastung und überlastungsindikatoren wie ecn-markier Pakete, PFC-Pausenframes und Paketfehler.

Die Sogenannte Deep-Dive-Analytik Sol Kritische, Jobspezifische Ereignnisse auf Switches und Server-Nices, Etwa Rdma-Fehler Oder-Fatal-Eronori, Erkennen Können. Weiterhin Sola Sie Zugehörige Flows had been identified, Um Performance-Engpässe Sehen Zu Können. Zudem Verfügt die Funktion über eine flow-visualisierung für abläufe von ki-jobs einer granularität von mikrosekunden. Im Bereich der Ki-Infrastructor Weiten nvidia und arista-konkurrent cisco ihre zusammenarbeit zuletzt weiter aus.


(SFE)