Inhalt
summary Zusammenfassung

Amazon präsentiert mit der Nova-Familie neue KI-Grundlagenmodelle für Text-, Bild- und Videoanalyse. Laut Benchmarks kann das Spitzenmodell Nova Pro in vielen Bereichen mit der Konkurrenz mithalten, setzt aber wohl keine neuen Maßstäbe.

Anzeige

Die Nova-Modelle sind laut Amazon auf das Kosten-Leistungs-Verhältnis optimiert und sollen die Lücke Lücke zu Konkurrenten wie OpenAI und Google schließen. Sie sind in zwei Kategorien unterteilt: Verständnismodelle und Modelle zur Generierung kreativer Inhalte.

Die Nova-Verständnismodelle verarbeiten Text-, Bild- oder Videoeingaben und generieren Textausgaben. Die "Creative"-Modelle akzeptieren Text- und Bildeingaben und erzeugen daraus Bild- oder Videoausgaben.

Das "Verständnis"-Einstiegsmodell Nova Micro ist auf reine Textverarbeitung spezialisiert und für schnelle Antworten bei niedrigen Kosten optimiert. Es kann bis zu 128.000 Token verarbeiten und eignet sich für Aufgaben wie Textzusammenfassungen, Übersetzungen und einfache mathematische Berechnungen sowie Code.

Anzeige
Anzeige

Multimodale Fähigkeiten für komplexere Aufgaben

Die leistungsfähigeren Varianten Nova Lite und Nova Pro beherrschen neben Text auch die Analyse von Bildern und Videos ohne Ton. Nova Pro kann dabei bis zu 300.000 Token verarbeiten und laut Amazon komplexe Workflows ausführen, bei denen APIs und externe Tools eingebunden werden müssen. Die Nova-Modelle liegen auch bei diesen visuellen oder agentischen Benchmarks auf Augenhöhe mit dem Wettbewerb.

Nova Pro liegt mit den gängigen anderen großen Sprachmodellen auf Augenhöhe. | Bild: via Amazon

Ein viertes Analysemodell "Nova Premier" soll Anfang 2025 folgen, das komplexe Schlussfolgerungen ziehen und synthetische Daten für andere KI-Modelle generieren kann. Es könnte die Amazon-Variante von OpenAIs o1 sein.

Die Nova-Text-Intelligence-Modelle können mit Text-, Bild- und Videodaten feinabgestimmt werden, um branchenspezifische Terminologie und den jeweiligen Anwendungsfall zu berücksichtigen. Alle technischen Daten sind hier verfügbar.

Für kreative Anwendungen stellt Amazon zwei weitere Modelle vor: Nova Canvas für Bildgenerierung und Nova Reel für Videoproduktion. Beide Modelle fügen automatisch digitale Wasserzeichen ein.

Verfügbarkeit zunächst eingeschränkt

Alle Nova-Modelle sind zunächst in drei US-Regionen exklusiv von Amazon Web Services verfügbar. Die Abrechnung erfolgt nach einem Pay-as-you-go-Modell.

Empfehlung

Die Modelle unterstützen mehr als 200 Sprachen, mit laut Amazon besonderer Stärke in 15 Hauptsprachen wie Englisch, Deutsch, Spanisch, Französisch und Chinesisch. Die Bild- und Videomodelle akzeptieren bislang nur englische Eingaben.

Mit den eigenen Modellen will Amazon eine strategische Lücke schließen: Zwar bietet der Konzern bereits viele KI-Modelle in der eigenen Cloud an, die Cloud-Konkurrenten Microsoft und Google haben aber durch ihre Partnerschaften mit OpenAI (Microsoft) oder eigene Modelle wie Gemini (Google) bisher die Nase vorn.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Amazon stellt mit der Nova-Familie neue KI-Grundmodelle für die Text-, Bild- und Videoanalyse vor. Sie sollen laut Amazon das Preis-Leistungs-Verhältnis optimieren.
  • Das leistungsfähigste Verstehensmodell Nova Pro kann in Benchmarks mit der Konkurrenz mithalten, setzt aber keine neuen Maßstäbe. Ein noch leistungsfähigeres Modell ist für Anfang 2025 angekündigt.
  • Mit den eigenen Modellen will Amazon eine strategische Lücke zu den Cloud-Konkurrenten Microsoft und Google schließen, die bisher durch Partnerschaften oder eigene Modelle die Nase vorn haben. Die Nova-Modelle sind zunächst exklusiv in drei US-Regionen über Amazon Web Services verfügbar.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!