Mistral AI hat die erste vollständige Lebenszyklusanalyse eines LLMs durchgeführt. Die Studie soll neue Transparenzstandards für die Branche setzen.
Die Analyse des Unternehmens-Flaggschiffs Mistral Large 2 zeigt erhebliche Umweltauswirkungen: Das Training und die anschließende 18-monatige Nutzung verursachte bis Januar 20,4 Kilotonnen CO₂-Äquivalente, verbrauchte 281.000 Kubikmeter Wasser und führte zu einem Ressourcenverbrauch von 660 Kilogramm Antimon-Äquivalenten. Antimon-Äquivalente messen den Verbrauch seltener Metalle und Mineralien, die für die Hardware-Herstellung benötigt werden.
Für eine einzelne 400-Token-Antwort des KI-Assistenten Le Chat ermittelten die Forschenden Auswirkungen von 1,14 Gramm CO₂-Äquivalente, 45 Milliliter Wasser und 0,16 Milligramm Antimon-Äquivalente pro Anfrage.

OpenAI-CEO Sam Altman hatte vor Kurzem angegeben, dass eine ChatGPT-Anfrage im Schnitt umgerechnet 0,32 Milliliter Wasser verbrauchen würde, also weniger als ein Hundertstel dessen. Offen ist, was genau bei OpenAI gemessen wurde und ob die Zahlen vergleichbar sind. Altman erwähnte diese Metrik nur in einem Nebensatz eines Blog-Artikels über Super-KI; eine transparente Auswertung der Umweltauswirkungen seiner KI-Systeme hat OpenAI bislang nicht vorgelegt.
Modellgröße bestimmt Umweltauswirkungen direkt
Die Zahlen spiegeln laut Mistral AI den enormen Rechenaufwand generativer KI wider, der zahlreiche GPUs erfordert, oft in Regionen mit kohlenstoffintensiver Elektrizität und teilweise unter Wasserstress. Das ist allerdings keine Überraschung, sondern hatte sich schon lange vor dem anhaltenden KI-Boom abgezeichnet.
Außerdem belegt die Studie eine starke Korrelation zwischen Modellgröße und Umwelt-Fußabdruck. Benchmarks zeigten, dass die Auswirkungen grob proportional zur Modellgröße seien: Ein zehnmal größeres Modell verursache für die gleiche Anzahl generierter Token Auswirkungen einer Größenordnung höher. Das unterstreiche die Bedeutung der richtigen Modellwahl für den jeweiligen Anwendungsfall.
Drei Indikatoren sollen Branchenstandard werden
Basierend auf den Studienergebnissen schlägt Mistral AI drei entscheidende Kennzahlen für die Branche vor: die absoluten Auswirkungen des Modell-Trainings, die Auswirkungen pro einzelner Inferenz-Anfrage und das Verhältnis von Gesamt-Inferenz zu Gesamtlebenszyklusauswirkungen.
Die ersten beiden Indikatoren sollten als Pflichtangaben eingeführt werden, um die Öffentlichkeit über Umweltauswirkungen zu informieren. Der dritte Indikator könne als interner Indikator mit optionaler Offenlegung dienen und sei entscheidend für eine vollständige Lebenszyklusperspektive.
Um die Umweltauswirkungen von LLMs zu reduzieren, sieht das Unternehmen zwei Ansatzpunkte: KI-Unternehmen sollten veröffentlichen, wie stark ihre Modelle die Umwelt belasten, und dabei standardisierte, international anerkannte Rahmenwerke verwenden. So könnten Bewertungssysteme entstehen, die Nutzer:innen dabei helfen, die umweltschonendsten Modelle zu finden.
Auch die Nutzer:innen können laut Mistral viel bewirken: Sie sollten lernen, wie sie generative KI optimal einsetzen, Modelle wählen, die zu ihren Bedürfnissen passen, und Anfragen bündeln, um unnötige Berechnungen zu vermeiden. Öffentliche Institutionen könnten ein starkes Signal an den Markt senden, wenn sie bei der Beschaffung darauf achten, wie groß und effizient die Modelle sind.
Methodische Herausforderungen bei Pionierstudie
Mistral AI räumt ein, dass die Studie lediglich eine erste Annäherung darstellt. Präzise Berechnungen seien schwierig, da keine Standards für LLM-Umweltbilanzierung existierten und öffentlich verfügbare Bewertungsfaktoren fehlten. Eine zuverlässige Lebenszyklusbilanz von GPUs müsse noch erstellt werden.
Mistral AI ist bestrebt, die Umweltberichte künftig zu aktualisieren und an Diskussionen über internationale Branchenstandards teilzunehmen. Die Ergebnisse sollen später über die Datenbank Base Empreinte verfügbar werden, eine französische Referenzdatenbank für Umweltauswirkungen verschiedener Produkte und Dienstleistungen.
Unter dem EU-AI-Act müssen Anbieter von General-Purpose AI Models bereits umfassende Energieverbrauchsdaten dokumentieren. Die Entwickler:innen sind verpflichtet, eine technische Dokumentation zu erstellen, die den Energieverbrauch ihrer KI-Modelle aufschlüsselt. Der Energieverbrauch ist auch ein Faktor dafür, ob ein Modell als "systemisches Risiko" eingestuft wird.