Amazon präsentiert mit der Nova-Familie neue KI-Grundlagenmodelle für Text-, Bild- und Videoanalyse. Laut Benchmarks kann das Spitzenmodell Nova Pro in vielen Bereichen mit der Konkurrenz mithalten, setzt aber wohl keine neuen Maßstäbe.
Die Nova-Modelle sind laut Amazon auf das Kosten-Leistungs-Verhältnis optimiert und sollen die Lücke Lücke zu Konkurrenten wie OpenAI und Google schließen. Sie sind in zwei Kategorien unterteilt: Verständnismodelle und Modelle zur Generierung kreativer Inhalte.
Die Nova-Verständnismodelle verarbeiten Text-, Bild- oder Videoeingaben und generieren Textausgaben. Die "Creative"-Modelle akzeptieren Text- und Bildeingaben und erzeugen daraus Bild- oder Videoausgaben.
Das "Verständnis"-Einstiegsmodell Nova Micro ist auf reine Textverarbeitung spezialisiert und für schnelle Antworten bei niedrigen Kosten optimiert. Es kann bis zu 128.000 Token verarbeiten und eignet sich für Aufgaben wie Textzusammenfassungen, Übersetzungen und einfache mathematische Berechnungen sowie Code.
Multimodale Fähigkeiten für komplexere Aufgaben
Die leistungsfähigeren Varianten Nova Lite und Nova Pro beherrschen neben Text auch die Analyse von Bildern und Videos ohne Ton. Nova Pro kann dabei bis zu 300.000 Token verarbeiten und laut Amazon komplexe Workflows ausführen, bei denen APIs und externe Tools eingebunden werden müssen. Die Nova-Modelle liegen auch bei diesen visuellen oder agentischen Benchmarks auf Augenhöhe mit dem Wettbewerb.
Ein viertes Analysemodell "Nova Premier" soll Anfang 2025 folgen, das komplexe Schlussfolgerungen ziehen und synthetische Daten für andere KI-Modelle generieren kann. Es könnte die Amazon-Variante von OpenAIs o1 sein.
Die Nova-Text-Intelligence-Modelle können mit Text-, Bild- und Videodaten feinabgestimmt werden, um branchenspezifische Terminologie und den jeweiligen Anwendungsfall zu berücksichtigen. Alle technischen Daten sind hier verfügbar.
Für kreative Anwendungen stellt Amazon zwei weitere Modelle vor: Nova Canvas für Bildgenerierung und Nova Reel für Videoproduktion. Beide Modelle fügen automatisch digitale Wasserzeichen ein.
Verfügbarkeit zunächst eingeschränkt
Alle Nova-Modelle sind zunächst in drei US-Regionen exklusiv von Amazon Web Services verfügbar. Die Abrechnung erfolgt nach einem Pay-as-you-go-Modell.
Die Modelle unterstützen mehr als 200 Sprachen, mit laut Amazon besonderer Stärke in 15 Hauptsprachen wie Englisch, Deutsch, Spanisch, Französisch und Chinesisch. Die Bild- und Videomodelle akzeptieren bislang nur englische Eingaben.
Mit den eigenen Modellen will Amazon eine strategische Lücke schließen: Zwar bietet der Konzern bereits viele KI-Modelle in der eigenen Cloud an, die Cloud-Konkurrenten Microsoft und Google haben aber durch ihre Partnerschaften mit OpenAI (Microsoft) oder eigene Modelle wie Gemini (Google) bisher die Nase vorn.