Inhalt
summary Zusammenfassung

Der KI-Chiphersteller Cerebras Systems will mit neuen Rechenzentren seine Inferenz-Kapazitäten ausbauen.

Anzeige

Die Standorte verteilen sich auf Nordamerika und Europa, wobei 85 Prozent der Kapazität in den USA liegen soll. Drei Rechenzentren in Santa Clara, Stockton und Dallas sind bereits aktiv. Minneapolis soll im zweiten Quartal 2025 folgen, Oklahoma City und Montreal im dritten Quartal sowie Atlanta und ein Standort in Frankreich im vierten Quartal.

Gestapeltes Säulendiagramm: Cerebras KI-Inferenzkapazität 2025 nach Quartalen und Regionen, zeigt 20-faches Wachstum von Q1 bis Q4.
Die Rechenkapazität von Cerebras für KI-Inferenz soll noch in 2025 stark wachsen und sich insbesondere auf die USA fokussieren. | Bild: Cerebras

Die technologische Basis der Rechenzentren bilden die sogenannten Wafer-Scale Engines, eine von Cerebras entwickelte Chip-Architektur, die speziell für KI-Anwendungen optimiert wurde. Laut Unternehmensangaben sollen die Anlagen mit CS-3-Systemen ausgestattet werden und eine Inferenzgeschwindigkeit von 40 Millionen Llama-70B-Tokens pro Sekunde erreichen.

Das geplante Rechenzentrum in Oklahoma City soll etwa über 300 CS-3-Systeme beherbergen. Die Anlage wird nach Level-3+-Standards gebaut, mit Schutz gegen Tornados und Erdbeben sowie dreifach redundanter Stromversorgung. Sie wird im Juni 2025 in Betrieb genommen.

Anzeige
Anzeige

Erste Kunden nutzen die Cerebras-Infrastruktur

Zu den ersten Nutzern der Cerebras-Infrastruktur gehören das französische KI-Startup Mistral mit seinem Assistenten Le Chat und die KI-Antwortmaschine Perplexity. Auch HuggingFace und AlphaSense haben sich für die Nutzung der Systeme entschieden.

Die Technologie zielt besonders auf Reasoning-Modelle wie Deepseek-R1 und OpenAI o3 ab, die für ihre Berechnungen üblicherweise mehrere Minuten benötigen und viele Token für ihre Denkprozesse generieren.

Die Expansion ist Teil eines Skalierungsplans für 2025. Einige der Standorte werden in Kooperation mit dem emiratischen Partner G42 betrieben. In Montreal betreibt Enovum, eine Tochter von Bit Digital, das dortige Rechenzentrum. Die Anlage soll eine zehnmal höhere Inferenzgeschwindigkeit als aktuelle GPUs erreichen und soll im Juli 2025 vollständig betriebsbereit sein.

Cerebras Systems ist ein US-amerikanisches Unternehmen, das sich auf die Entwicklung spezieller KI-Chips konzentriert. Das Besondere: Cerebras nutzt einen kompletten Wafer als einen einzigen Chip, die sogenannte "Wafer Scale Engine". Der WSE-3 ist die dritte Generation des Wafer-Scale-KI-Chips von Cerebras Systems.

Die Technologie kommt bereits in verschiedenen Einrichtungen zum Einsatz, darunter das Argonne National Laboratory, das Pittsburgh Supercomputing Center und GlaxoSmithKline. Allerdings gibt es auch Einschränkungen: Das System läuft nicht mit nativem CUDA (Nvidia-Standard) und ist weniger flexibel als Nvidia-Lösungen bezüglich der Server-Kompatibilität.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • KI-Chip-Hersteller Cerebras Systems baut Rechenzentren in Nordamerika und Europa. Die Anlagen sollen besonders schnelle Inferenzzeiten bieten und bis zu 40 Millionen Llama-70B-Tokens pro Sekunde verarbeiten können.
  • Grundlage der Anlagen sind spezielle Wafer-Scale-Chips, bei denen ein kompletter Siliziumwafer als einzelner Chip eingesetzt wird; allein das geplante Zentrum in Oklahoma City soll etwa 300 dieser Systeme erhalten.
  • Erste Kunden der neuen Infrastruktur sind unter anderem das KI-Startup Mistral, die Suchmaschine Perplexity sowie HuggingFace und AlphaSense; ab Mitte 2025 sollen die ersten Standorte betriebsbereit sein.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!