WccftechTechnologie

Tenstorrent droht, mit dem Galaxy Blackhole, das 350 Tokens/s auf DeepSeek R1 erreicht, NVIDIAs GB300 AI TCO zu unterbieten

Tenstorrent machte whrend ihres TT-Deploy Livestreams eine khne Aussage und sagte, sie wrden mit ihren Galaxy-Servern in allem, einschlielich KI, alle berrollen.

2. Mai 2026Hassan MujtabaLive Redaktion
Tenstorrent Vows to ‘Crush Everyone’ as Galaxy Blackhole Hits 350 Tokens/s on DeepSeek R1, Undercutting NVIDIA’s GB300 AI TCO

Kurzfassung

Warum das wichtig ist

WccftechTechnologie
  • Tenstorrent machte whrend ihres TT-Deploy Livestreams eine khne Aussage und sagte, sie wrden mit ihren Galaxy-Servern in allem, einschlielich KI, alle berrollen.
  • Jim Keller und sein Tenstorrent sind auf einer Mission, die bestehende KI-Hierarchie mit ihren RISC-V-betriebenen Plattformen herauszufordern.
  • Daher stellte das Unternehmen seine neuesten Galaxy Blackhole-Server fr KI im groen Mastab vor.

Mit Galaxy Blackhole bietet Tenstorrent eine vollstndig vernetzte und native KI-Lsung, die Compute, Speicher und Netzwerk umfasst, alles vereint in einem einzigen System, das fr die neuesten KI-Workloads optimiert ist.

Die Worte fallen. Wir sind entschlossen, bei allem alle zu berrollen. Testen Sie es selbst. h&.. das ist khn. =@ pic.twitter.com/GB7OVIDwS0 Der Chip in den Galaxy-Servern heit Blackhole und basiert auf der RISC-V-Architektur, die mit ARM und x86 konkurriert.

Whrend der Veranstaltung sagte Jim Keller, dass das A0-Silizium bereits ausgeliefert wird, es aber Software-Bugs gibt, an denen sie arbeiten. Um die Leistung seines Galaxy Blackhole Superclusters zu demonstrieren, führte Tenstorrent während des TT-Deploy Livestreams verschiedene Demos durch.

Beginnen wir mit den , der

Beginnen wir mit den , der die Blackhole-Chips antreibt, heißt Tensix und verfügt über fünf RISC-Prozessoren mit Matrix-Multiplikations-Einheiten, Vektoreinheiten und lokalem SRAM.

Jeder RISC-Prozessor ist vollständig programmierbar und jeder Kern ist an ein Hochbandbreiten-NOC angeschlossen. Und mehrere dieser Tensor-"Tensix"-Kerne werden zusammen eingesetzt, um einen Chip zu bilden.

Tenstorrent erklärt, dass bei konkurrierenden GPUs wie der GB300 drastisch reduziert wird, um einen höheren Token-Durchsatz zu erreichen.

Das ist nicht der Fall bei

Das ist nicht der Fall bei den Galaxy-Servern , die einen niedrigeren Token-Kostenpunkt ($6 gegenüber ca. $30) aufweisen und für Unternehmen, die diese Server nutzen, eine viel niedrigere TCO erzielen.

Wir haben letzte Woche auch darüber gesprochen, und Tenstorrent hat offiziell eine bis zu schnellere Video-GenAI-Leistung auf seinem Galaxy Supercluster vorgeführt. Das System ist in der Lage, ein 81-Frame (720p) Video in nur 2,4 Sekunden zu generieren.

Das ist ein 5-Sekunden-Video, das in 2,4 Sekunden generiert wird, schneller als Echtzeit. Zusätzlich zur GenAI-Demo stellte Tenstorrent auch Blitz Mode für seinen Galaxy Blackhole Server vor.

Blitz Mode auf Galaxy ist für

Blitz Mode auf Galaxy ist für Premium-Workloads mit latenzempfindlicher KI optimiert. Mit diesem Modus können Galaxy Server bis zu 350 Tokens/s auf Deepseek R1-0528 671B erreichen und übertreffen damit schnell die GPU-Konkurrenz.

Die beiden vorgestellten Benchmarks sind unten aufgeführt: Hinsichtlich Preisgestaltung und Verfügbarkeit wird der Tenstorrent Galaxy Blackhole Server in einer luftgekühlten Rack-Konfiguration mit Next-Generation Blackhole Chips und einem vollständig quelloffenen Software-Stack ab einem Preis von $110.000 erhältlich sein.

Das System bietet 23 PFLOPs an FP8 (AI)-Rechenleistung über 32 Blackhole Chips, 6,2 GB On-Chip SRAM bei 2,9 PB/s, 1 TB DRAM bei 16 TB/s und 56 x 800G Ethernet Ports für bis zu 11,2 GB/s Scale-out-Bandbreite. 2 von 9 Kunden können Galaxy Blackhole auch in Supercluster-Konfigurationen mit 4-36 Galaxy Servern erwerben.

Die Basis-Konfiguration mit 4 Galaxy Servern

Die Basis-Konfiguration mit 4 Galaxy Servern beginnt bei $440,000. Über den Autor: Hassan Mujtaba ist PC-Enthusiast und fungiert als Senior Editor für den Hardware-Bereich bei Wccftech.

Mit jahrelanger Erfahrung in der Branche spezialisiert er sich auf tiefgehende technische Analysen nächsten Generation, Motherboards und Kühllösungen. Seine Arbeit umfasst nicht nur Breaking News zu kommenden Technologien, sondern auch umfangreiche praktische Tests und Benchmarks.

Sie Wccftech auf Google, um mehr zu erhalten.

Quellenprofil

Quelle und redaktionelle Angaben

Quelle
Wccftech
Originaltitel
Tenstorrent Vows to ‘Crush Everyone’ as Galaxy Blackhole Hits 350 Tokens/s on DeepSeek R1, Undercutting NVIDIA’s GB300 AI TCO
Canonical
https://wccftech.com/tenstorrent-vows-to-crush-everyone-galaxy-blackhole-hits-350-tokens-on-deepseek-r1-undercut-nvidia-gb300-ai-tco/
Quell-URL
https://wccftech.com/tenstorrent-vows-to-crush-everyone-galaxy-blackhole-hits-350-tokens-on-deepseek-r1-undercut-nvidia-gb300-ai-tco/

Aehnliche Inhalte

Verwandte Themen und interne Verlinkung

Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.