Anzeige
Skip to content
Read full article about: Mistral OCR 3 soll Texte günstiger und besser erkennen

Mistral AI hat mit Mistral OCR 3 eine aktualisierte Version seines Modells zur Dokumentenanalyse veröffentlicht. Das System extrahiert nicht nur Texte und eingebettete Bilder, sondern interpretiert auch kursive Handschriften, dichte Formular-Layouts und komplexe Tabellenstrukturen inklusive verbundener Zellen. Laut dem Unternehmen übertrifft die dritte Version den Vorgänger in 74 Prozent der Fälle, vor allem bei der Verarbeitung von Handschriften, gescannten Formularen und komplexen Tabellen. Auch gegenüber Deepseeks spezialisiertem Modell zur Zeichenerkennung schneidet OCR 3 gut ab.

Das Modell ist über eine API oder die im Mai vorgestellte Plattform Document AI verfügbar. Der Preis liegt bei zwei US-Dollar pro 1.000 Seiten, wobei Großaufträge günstiger sind. Das französische Unternehmen, das zuletzt eine große Investition vom Chiphersteller ASML erhalten hat, baut damit seine Positionierung im Bereich der Dokumentenerkennung weiterhin aus, während die Open-Weight-Sprachmodelle der aktuellen Generation hinter kommerziellen Konkurrenten aus den USA zurückbleiben.

Read full article about: KI im Newsroom: OpenAI launcht Schulungsprogramm für Medienhäuser

OpenAI hat die "Academy for News Organizations" gestartet, eine neue Lernplattform für Journalisten und Publisher. Ziel der Initiative in Zusammenarbeit mit dem American Journalism Project und dem Lenfest Institute ist es, Medienhäusern den Umgang mit Künstlicher Intelligenz näherzubringen. Das Angebot umfasst On-Demand-Schulungen, praktische Anwendungsbeispiele für Recherchen und Übersetzungen sowie Hilfestellungen für interne Richtlinien. OpenAI betont, dass Redaktionen durch die Nutzung von KI effizienter arbeiten sollen, um mehr Zeit für die journalistische Kernarbeit zu haben.

Laut OpenAI wurden bei der Entwicklung der Akademie auch kritische Themen berücksichtigt, etwa die Sorge um Arbeitsplätze und die Zuverlässigkeit von KI-Inhalten. Die Plattform baut auf bestehenden Kooperationen mit Verlagen wie News Corp und Hearst auf und soll im nächsten Jahr weiter ausgebaut werden. Derartige Förderangebote sind vielleicht auch dazu gedacht, die Wogen zu glätten: Auf der anderen Seite streitet sich OpenAI nämlich mit großen Medienhäusern wie der New York Times oder Ziff Davis ums Urheberrecht.

Read full article about: OpenAI startet App-Einreichungen und rollt Store im neuen Jahr aus

OpenAI nimmt ab sofort Einreichungen für ChatGPT-Apps entgegen, die nach einer Prüfung in einem neuen Verzeichnis erscheinen. Die Anwendungen erweitern Konversationen um konkrete Aktionen, etwa zum Bestellen von Lebensmitteln. Nutzer finden das Verzeichnis im Tools-Menü und starten Apps per @-Befehl. Ein Software Development Kit (SDK) steht als Beta bereit, wobei die ersten geprüften Anwendungen Anfang 2026 starten sollen.

Bezüglich der Sicherheit verlangt das Unternehmen unter anderem, dass Apps für alle Zielgruppen geeignet sind und nur zwingend notwendige Informationen abfragen. In dieser frühen Phase können Entwickler aus ihren ChatGPT-Apps auf ihre eigenen Websites oder nativen Apps verlinken, um Transaktionen für physische Güter abzuschließen. OpenAI erkundet über die Zeit aber weitere Monetarisierungsoptionen, einschließlich für digitale Güter, und will dazu später mehr teilen; seit einigen Monaten kooperiert das Unternehmen schon mit PayPal. Die Öffnung folgt auf den Dev Day im Oktober, auf dem OpenAI neben dem Apps-SDK das AgentKit für autonome KI-Agenten präsentierte.

Read full article about: OpenAI will angeblich bis zu 100 Milliarden US-Dollar einsammeln

OpenAI führt angeblich vorläufige Gespräche mit Investoren über eine neue Finanzierungsrunde. Die angestrebte Bewertung liegt dann bei rund 750 Milliarden Dollar, berichtet The Information. Das Unternehmen könnte dabei mehrere zehn Milliarden Dollar einsammeln, möglicherweise sogar bis zu 100 Milliarden Dollar.

Die Gespräche befinden sich noch in einem frühen Stadium, nichts sei finalisiert, so die Quellen. Eine Bewertung in dieser Höhe würde einen Anstieg von 50 Prozent gegenüber dem letzten Aktienverkauf im Oktober bedeuten.

Zudem verhandelt Amazon derzeit über eine Investition von 10 Milliarden Dollar oder mehr. Hier handelt es sich erneut um ein Zirkelgeschäft: Der Tech-Konzern gibt OpenAI Geld, für das er dann bei Amazon Chips und Rechenleistung kauft.

OpenAI erreichte laut The Information einen annualisierten Umsatz von 19 Milliarden Dollar und liegt damit auf Kurs, sein Ziel von 20 Milliarden Dollar annualisiertem Umsatz bis Jahresende zu erreichen. Für 2026 prognostiziert OpenAI einen Umsatz von 30 Milliarden Dollar, bis 2030 sollen es rund 200 Milliarden Dollar werden. Demgegenüber steht ein enormer Cashburn von rund 26 Milliarden US-Dollar pro Jahr.

Read full article about: Mathe-Star Terence Tao definiert KI neu: Cleverness statt echter Intelligenz

Der KI-interessierte Mathematik-Star Terence Tao hat eine eigene KI-Definition. Der Mathematiker bezweifelt auf Mastodon, dass echte "künstliche allgemeine Intelligenz" (AGI) mit aktuellen KI-Werkzeugen erreichbar ist. Stattdessen schlägt er den Begriff "künstliche allgemeine Cleverness" (AGC) vor.

Laut Tao bedeutet "allgemeine Cleverness" die Fähigkeit, komplexe Probleme mit teils improvisierten Mitteln zu lösen. Diese Lösungen können zufallsbasiert sein, auf roher Rechenleistung beruhen oder aus Trainingsdaten stammen. Sie seien daher keine echte "Intelligenz", könnten aber bei vielen Aufgaben erfolgreich sein, besonders wenn strenge Prüfverfahren falsche Ergebnisse aussortieren.

Das Ergebnis sei eine Technologie, die gleichzeitig nützlich und unbefriedigend wirke, ähnlich wie ein Zaubertrick, dessen Wirkung nachlässt, sobald man den Trick kennt. Bei Menschen seien Cleverness und Intelligenz verbunden, bei KI jedoch entkoppelt, so Tao. Der Mathematiker hatte sich zuletzt mehrfach positiv darüber geäußert, dass KI seine Arbeit beschleunigt habe.

Nvidia veröffentlicht Nemotron 3: Hybride Mamba-Modelle für autonome KI-Agenten

Nvidia bricht mit reinen Transformer-Modellen: Die neue Nemotron-3-Familie kombiniert Mamba-2- und Transformer-Architekturen, um KI-Agenten mit Millionen-Token-Kontextfenstern ressourcenschonend zu betreiben, und veröffentlicht ungewöhnlich offen Trainingsdaten und Rezepte.

Google stellt günstigeres und schnelleres Gemini-3-Flash-Modell vor

Der Preiskampf bei KI-Modellen verschärft sich: Google bringt mit Gemini 3 Flash ein Modell auf den Markt, das die Konkurrenz von OpenAI und Anthropic bei Kosten und Geschwindigkeit deutlich unterbieten soll. Die Botschaft ist klar: Spitzenleistung muss nicht mehr teuer sein.

Read full article about: Amazon verhandelt über 10-Milliarden-Dollar-Investition in OpenAI

Amazon führt Gespräche über eine Investition von mindestens 10 Milliarden Dollar in OpenAI. Das berichten drei mit den Diskussionen vertraute Personen gegenüber The Information. Die Bewertung von OpenAI würde dabei auf über 500 Milliarden Dollar steigen. Das Geld soll OpenAI helfen, Serverkosten zu decken, darunter einen kürzlich vereinbarten 38-Milliarden-Dollar-Deal mit Amazon Web Services (AWS). Teil der Vereinbarung wäre auch, dass OpenAI Amazons eigene KI-Chips "Trainium" nutzt, anstatt sich nur auf Nvidia zu verlassen.

Zusätzlich diskutieren die Unternehmen über eine mögliche Umwandlung von ChatGPT in eine Einkaufsplattform. Allerdings könnte Microsofts exklusives Recht, OpenAI-Modelle an Cloud-Kunden zu verkaufen, die Möglichkeiten für Amazon einschränken. Die Gespräche begannen im Oktober nach der Unternehmensumstrukturierung von OpenAI, sind aber noch nicht abgeschlossen. OpenAI benötigt weiterhin dringend Kapital, da das Unternehmen erwartet, in den nächsten vier Jahren über 100 Milliarden Dollar zu verbrennen.

Read full article about: Google hat einen neuen KI-Agenten, der helfen soll, den Tag zu planen

Google hat einen neuen KI-Agenten, der helfen soll, den Tag zu planen. Der experimentelle Produktivitätsassistent namens CC stammt aus den Google Labs und basiert auf Gemini. Nach der Anmeldung verbindet sich CC mit Gmail, Google Kalender, Google Drive und dem Internet, um den Tagesablauf des Nutzers zu verstehen. Solche KI-Agenten mit Zugriff auf private Daten werfen bekannte Sicherheitsfragen auf.

Jeden Morgen liefert CC eine Zusammenfassung namens "Your Day Ahead" per E-Mail. Diese fasst Termine, wichtige Aufgaben und Neuigkeiten zusammen, etwa anstehende Rechnungen oder Termine. Der Agent erstellt bei Bedarf auch E-Mail-Entwürfe und Kalendereinträge. Nutzer können CC per E-Mail-Antwort steuern, eigene Wünsche mitteilen oder den Agenten bitten, sich Ideen und Aufgaben zu merken.

CC startet als früher Testlauf zunächst für Nutzer ab 18 Jahren in den USA und Kanada. Voraussetzung ist ein privates Google-Konto sowie ein Abo von Google AI Ultra oder anderen kostenpflichtigen Diensten. Interessierte können sich auf der Google Labs-Website für die Warteliste anmelden.