Anzeige
Skip to content

Jonathan Kemper

Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Read full article about: FunctionGemma: Googles lokale Mini-KI steuert Apps und Spiele per Sprache

Google hat FunctionGemma veröffentlicht, eine spezialisierte Version des kleinen Sprachmodells Gemma 3 270M. Das Modell wurde basierend auf dem im August vorgestellten Basismodell gezielt für das sogenannte "Function Calling" erweitert. Damit kann die KI nicht nur Texte generieren, sondern konkrete Befehle an Software weitergeben, um Kalendereinträge zu erstellen oder Spielelemente zu steuern. Über die AI Edge Gallery lässt sich auf Android-Geräten ein Farming-Minispiel ausprobieren, das Prompts wie "Plant the sunflower seed in plot 8" umsetzt. Hier gibt es eine Demo mit Physikrätseln, die sich durch natürliche Sprache direkt im Browser lösen lassen.

Da das Modell sehr kompakt ist, läuft es direkt auf Endgeräten wie Smartphones, was die Datensicherheit erhöht und Verzögerungen minimiert. Laut Google lässt sich die Zuverlässigkeit durch weiteres Training von 58 auf 85 Prozent steigern. FunctionGemma dient als Brücke zwischen natürlicher Sprache und Software und kann auch als "Verkehrsleiter" fungieren, der komplexe Anfragen an größere Modelle weiterleitet. Das Modell ist ab sofort auf Plattformen wie Hugging Face und Kaggle verfügbar.

Read full article about: OpenAI weitet Zugang zu günstigerem ChatGPT-Tarif "Go" deutlich aus

OpenAI hat die Verfügbarkeit seines günstigen Abonnements ChatGPT Go massiv ausgeweitet. Nach dem Start im August in Indien ist das Abo nun in über 70 weiteren Ländern verfügbar, darunter viele in Europa und Südamerika, wie aus einem aktualisierten Hilfe-Dokument hervorgeht. In Deutschland kostet der Zugang 8 Euro monatlich. Neben dem erweiterten Zugriff auf das Flaggschiff-Modell umfasst das Abo auch mehr Möglichkeiten zur Bildgenerierung, Datei-Analyse und Datenauswertung sowie ein größeres Kontextfenster für längere Gespräche. Nutzer können zudem Projekte organisieren und eigene GPTs erstellen. Nicht enthalten sind hingegen der Zugriff auf Sora, die API oder ältere Modelle wie GPT-4o.

Dem breiteren Rollout geht auch eine Sparmaßnahme voran: OpenAI hat den automatischen Modell-Router für Nutzer der kostenlosen Version und des Go-Abos kürzlich entfernt. Anfragen werden nun standardmäßig vom schnelleren GPT-5.2 Instant beantwortet. Nutzer müssen die leistungsfähigeren Reasoning-Modelle nun manuell auswählen, während der automatische Router nur noch in den teureren Tarifen aktiv bleibt.

Read full article about: Meta plant neue KI-Modelle Mango und Avocado für 2026

Meta entwickelt unter den Codenamen "Mango" und "Avocado" neue KI-Modelle für Bilder, Videos und Text. Die Veröffentlichung ist für die erste Jahreshälfte 2026 geplant, berichtet das Wall Street Journal unter Berufung auf interne Aussagen von Metas KI-Chef Alexandr Wang. Wang erklärte in einem internen Q&A mit Produktchef Chris Cox, dass "Mango" auf visuelle Inhalte fokussiert ist, während das Sprachmodell "Avocado" besonders gut im Programmieren sein soll. Zudem erforscht Meta sogenannte Weltmodelle, die ihre Umgebung visuell erfassen.

Hintergrund ist eine Umstrukturierung, bei der CEO Mark Zuckerberg persönlich Forscher von OpenAI abwarb und die Abteilung "Meta Superintelligence Labs" unter Wangs Leitung gründete. Der Markt für Bildgenerierung ist zudem umkämpft. Gerade erst hatte Google mit Nano Banana Pro ein beeindruckendes Modell mit präziser Promptbefolgung veröffentlicht, wenige Wochen später legte OpenAI mit GPT Image 1.5 nach. Zuletzt hatte Meta im April die vierte Generation seiner Llama-Reihe vorgestellt und arbeitet für den Videofeed Vibes mit Midjourney und Black Forest Labs zusammen.

Read full article about: Vibe-Coding-App Lovable läutet nach Finanzierungsrunde die "Age of the Builder" ein

Das europäische KI-Startup Lovable hat eine Series-B-Finanzierungsrunde über 330 Millionen Dollar abgeschlossen und wird nun mit 6,6 Milliarden Dollar bewertet. Die unter anderem von Google angeführte Runde umfasst Investitionen von Nvidia, HubSpot und der Deutschen Telekom. Das Unternehmen, mit der Nutzer Webanwendungen durch Textprompts erstellen können, gilt als eines der am schnellsten wachsenden Startups weltweit. Laut eigenen Angaben erreichte das in Schweden ansässige Start-up mit inzwischen 120 Mitarbeitenden innerhalb von acht Monaten nach der ersten Million einen jährlich wiederkehrenden Umsatz von 100 Millionen Dollar. Im Sommer schloss es auch eine der größten europäischen Series-A-Runden über 200 Millionen bei einer Bewertung von 1,8 Milliarden US-Dollar ab.

Lovable ruft dabei die "Age of the Builder" aus: Eine Zeit, in der Menschen ohne technische Vorkenntnisse – etwa Lehrer, Marketer oder Gründer – ihre Ideen eigenständig in Software verwandeln können. Trotz des rasanten Wachstums bleibt Lovable in absoluten Nutzerzahlen hinter Marktführern wie ChatGPT zurück. Kürzlich sammelte der US-Konkurrent Cursor 2,3 Milliarden Dollar ein, was den intensiven Wettbewerb im Bereich der KI-gestützten Softwareentwicklung, aber auch den Unterschied im Investitionsvolumen unterstreicht.

Read full article about: Mistral OCR 3 soll Texte günstiger und besser erkennen

Mistral AI hat mit Mistral OCR 3 eine aktualisierte Version seines Modells zur Dokumentenanalyse veröffentlicht. Das System extrahiert nicht nur Texte und eingebettete Bilder, sondern interpretiert auch kursive Handschriften, dichte Formular-Layouts und komplexe Tabellenstrukturen inklusive verbundener Zellen. Laut dem Unternehmen übertrifft die dritte Version den Vorgänger in 74 Prozent der Fälle, vor allem bei der Verarbeitung von Handschriften, gescannten Formularen und komplexen Tabellen. Auch gegenüber Deepseeks spezialisiertem Modell zur Zeichenerkennung schneidet OCR 3 gut ab.

Das Modell ist über eine API oder die im Mai vorgestellte Plattform Document AI verfügbar. Der Preis liegt bei zwei US-Dollar pro 1.000 Seiten, wobei Großaufträge günstiger sind. Das französische Unternehmen, das zuletzt eine große Investition vom Chiphersteller ASML erhalten hat, baut damit seine Positionierung im Bereich der Dokumentenerkennung weiterhin aus, während die Open-Weight-Sprachmodelle der aktuellen Generation hinter kommerziellen Konkurrenten aus den USA zurückbleiben.

Read full article about: KI im Newsroom: OpenAI launcht Schulungsprogramm für Medienhäuser

OpenAI hat die "Academy for News Organizations" gestartet, eine neue Lernplattform für Journalisten und Publisher. Ziel der Initiative in Zusammenarbeit mit dem American Journalism Project und dem Lenfest Institute ist es, Medienhäusern den Umgang mit Künstlicher Intelligenz näherzubringen. Das Angebot umfasst On-Demand-Schulungen, praktische Anwendungsbeispiele für Recherchen und Übersetzungen sowie Hilfestellungen für interne Richtlinien. OpenAI betont, dass Redaktionen durch die Nutzung von KI effizienter arbeiten sollen, um mehr Zeit für die journalistische Kernarbeit zu haben.

Laut OpenAI wurden bei der Entwicklung der Akademie auch kritische Themen berücksichtigt, etwa die Sorge um Arbeitsplätze und die Zuverlässigkeit von KI-Inhalten. Die Plattform baut auf bestehenden Kooperationen mit Verlagen wie News Corp und Hearst auf und soll im nächsten Jahr weiter ausgebaut werden. Derartige Förderangebote sind vielleicht auch dazu gedacht, die Wogen zu glätten: Auf der anderen Seite streitet sich OpenAI nämlich mit großen Medienhäusern wie der New York Times oder Ziff Davis ums Urheberrecht.

Read full article about: OpenAI startet App-Einreichungen und rollt Store im neuen Jahr aus

OpenAI nimmt ab sofort Einreichungen für ChatGPT-Apps entgegen, die nach einer Prüfung in einem neuen Verzeichnis erscheinen. Die Anwendungen erweitern Konversationen um konkrete Aktionen, etwa zum Bestellen von Lebensmitteln. Nutzer finden das Verzeichnis im Tools-Menü und starten Apps per @-Befehl. Ein Software Development Kit (SDK) steht als Beta bereit, wobei die ersten geprüften Anwendungen Anfang 2026 starten sollen.

Bezüglich der Sicherheit verlangt das Unternehmen unter anderem, dass Apps für alle Zielgruppen geeignet sind und nur zwingend notwendige Informationen abfragen. In dieser frühen Phase können Entwickler aus ihren ChatGPT-Apps auf ihre eigenen Websites oder nativen Apps verlinken, um Transaktionen für physische Güter abzuschließen. OpenAI erkundet über die Zeit aber weitere Monetarisierungsoptionen, einschließlich für digitale Güter, und will dazu später mehr teilen; seit einigen Monaten kooperiert das Unternehmen schon mit PayPal. Die Öffnung folgt auf den Dev Day im Oktober, auf dem OpenAI neben dem Apps-SDK das AgentKit für autonome KI-Agenten präsentierte.

Nvidia veröffentlicht Nemotron 3: Hybride Mamba-Modelle für autonome KI-Agenten

Nvidia bricht mit reinen Transformer-Modellen: Die neue Nemotron-3-Familie kombiniert Mamba-2- und Transformer-Architekturen, um KI-Agenten mit Millionen-Token-Kontextfenstern ressourcenschonend zu betreiben, und veröffentlicht ungewöhnlich offen Trainingsdaten und Rezepte.