Neues aus der Google-Schmiede: Die Trillium TPU ist da

Google hat auf der diesjährigen Google I/O 2024 die neueste Generation seiner Tensor Processing Units (TPUs) vorgestellt. Die neue TPU hört auf den Namen Trillium und markiert einen bedeutenden Sprung in Sachen Rechenleistung und Effizienz.

Was ist eine TPU?

Eine Tensor Processing Unit (TPU) ist ein spezieller Prozessor, der von Google entwickelt wurde, um die Berechnung von maschinellen Lernalgorithmen zu beschleunigen. TPUs sind darauf optimiert, komplexe mathematische Operationen durchzuführen, die bei der Ausführung von Künstlicher Intelligenz (KI) und maschinellem Lernen erforderlich sind. Diese spezialisierten Chips bieten eine höhere Leistung und Effizienz im Vergleich zu herkömmlichen CPUs und GPUs, insbesondere bei der Verarbeitung großer Datenmengen und der Durchführung umfangreicher neuronaler Netzwerke.

Ein Quantensprung in der Leistung

Trillium, die sechste Generation der von Google entwickelten TPUs, bietet eine fast fünffache Leistungssteigerung im Vergleich zu ihrem Vorgänger, der TPU v5e, die erst im August 2023 angekündigt wurde. Diese Leistungssteigerung wird durch größere Matrix-Multiplikatoren (MXUs), einen höheren Takt und einen verbesserten SparseCore erreicht, der gezielt Teile großer Workloads auslagert. Darüber hinaus ist Trillium 67 Prozent energieeffizienter als die v5e.

Verbessertes Netzwerk und höhere Skalierbarkeit

Ein großes Merkmal von Trillium ist die Möglichkeit, bis zu 256 dieser TPUs zu einem ultraschnellen „Pod“ zu verbinden. Die Bandbreite der optischen Verbindungen wurde verdoppelt, was eine noch höhere Leistung ermöglicht. Sollte ein Pod nicht ausreichen, können mehrere Pods über Googles eigenes optisches Netzwerk, genannt Jupiter, kombiniert werden. Diese Flexibilität und Skalierbarkeit machen Trillium zu einer idealen Lösung für anspruchsvolle KI-Modelle und -Anwendungen.

Größerer und schnellerer Speicher

Neben der gesteigerten Rechenleistung hat Google auch die Größe und Bandbreite des HBM-Speichers (High Bandwidth Memory) verdoppelt. Dies trägt dazu bei, dass Trillium die zuletzt vorgestellte TPU v5p in Sachen Rechenleistung überholt, obwohl die v5p in anderen Bereichen weiterhin führt. Es ist jedoch zu erwarten, dass auch hier später im Jahr ein Nachfolger präsentiert wird.

Anwendungen und Kundeninteresse

Wie bereits seine Vorgänger, wird auch Trillium in Googles eigenen Rechenzentren zum Einsatz kommen. Ein besonderes Augenmerk liegt dabei auf der Unterstützung zukünftiger Versionen von Googles eigenem Sprachmodell Gemini. Zusätzlich haben bereits verschiedene Unternehmen ihr Interesse an Trillium signalisiert. Darunter das Robotikunternehmen Nuro, Deep Genomics für die Medikamentenentwicklung und der Wirtschaftsprüfer und -berater Deloitte.

Fazit

Mit Trillium zeigt Google, wie die Hardware mit den wachsenden Anforderungen an KI-Modelle Schritt halten kann. Die deutlich höhere Rechenleistung und Effizienz, kombiniert mit verbesserter Skalierbarkeit und größerem Speicher, machen Trillium zu einer guten Wahl für moderne KI-Anwendungen.

 

Bildrechte:
© stock.adobe.com, JHVEPhoto