Anzeige
Skip to content

Mistral AI startet neue KI-OCR-Funktion mit eindrucksvollen Ergebnissen

Image description
Mistral AI

Das französische KI-Unternehmen Mistral AI stellt eine neue OCR-API vor, die Dokumente mit bisher unerreichter Genauigkeit verarbeitet und dabei Texte, Tabellen und Bilder gleichermaßen versteht.

Laut Ankündigung von Mistral AI soll die neue OCR-API einen Meilenstein in der Dokumentenverarbeitung darstellen. Das System kann neben Text auch Medien, Tabellen und mathematische Gleichungen mit hoher Präzision erfassen und verarbeiten. Sogar komplexe Infografiken kann das System aus Dokumenten übernehmen und digitalisieren.

In Benchmark-Tests übertrifft Mistral OCR die Konkurrenz: Mit einer Genauigkeit von 94,89 Prozent liegt das System vor Google Document AI (83,42 Prozent), Azure OCR (89,52 Prozent) und verschiedenen Gemini-Modellen von Google.

Multilingual und blitzschnell

Eine besondere Stärke des Systems ist die Verarbeitung verschiedener Sprachen. Nach Angaben von Mistral AI erreicht die OCR-API eine Genauigkeit von 99,02 Prozent über verschiedene Sprachen hinweg und übertrifft damit Google Document AI (95,88 Prozent) und Azure OCR (97,31 Prozent).

Anzeige
DEC_D_Incontent-1

Neben der hohen Genauigkeit hebt Mistral AI die Verarbeitungsgeschwindigkeit hervor: Bis zu 2000 Seiten könne das System innerhalb einer Minute auf einem einzigen Rechenknoten verarbeiten. Möglich wird dies durch die vergleichsweise leichte Architektur des Modells. Der Preis liegt bei 1000 Seiten pro Dollar, bei Batch-Verarbeitung verdoppelt sich die Seitenzahl pro Dollar.

Mistral AI nennt verschiedene Anwendungsfälle: Forschungseinrichtungen nutzen das System zur Digitalisierung wissenschaftlicher Arbeiten, Organisationen zur Bewahrung historischer Dokumente und Kundenservice-Abteilungen zur Verbesserung ihrer Wissensdatenbanken.

Eine Besonderheit ist die "Doc-as-prompt"-Funktion, die es ermöglicht, Dokumente direkt als KI-Anweisungen zu verwenden. Zum Beispiel könnte ein längerer Vertrag als Prompt dienen, woraufhin die KI automatisch bestimmte Informationen wie Vertragsparteien, Laufzeiten oder Zahlungen herausfiltert und übersichtlich strukturiert bereitstellt.

Mistral OCR erlaubt zudem die strukturierte Ausgabe erfasster Inhalte, beispielsweise im JSON-Format, was die Weiterverarbeitung in nachgelagerten KI-Systemen oder als Grundlage für KI-Agenten erleichtern soll.

Anzeige
DEC_D_Incontent-2

Für Organisationen mit hohen Sicherheitsanforderungen bietet Mistral AI eine Self-Hosting-Option an. Die API ist auf der Entwicklerplattform "la Plateforme" verfügbar und soll bald auch über Cloud- und Inferenz-Partner angeboten werden. Kostenlos testen kann man sie in Mistrals ChatGPT-Variante "le Chat", zum Zeitpunkt der Veröffentlichung dieses Artikels klappte das allerdings nicht.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Mistral

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren