Anzeige
Skip to content

Matthias Bastian

Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Read full article about: Adobe stellt neuen Firefly AI Assistant für komplexe kreative Workflows vor

Adobe stellt den Firefly AI Assistant vor, einen neuen KI-Assistenten, der komplexe kreative Arbeitsabläufe über eine einzige Chat-Oberfläche steuert. Der Assistent verbindet Adobes Apps wie Photoshop, Illustrator, Premiere und Lightroom. Nutzer beschreiben in eigenen Worten, was sie erstellen wollen, und der Assistent führt die nötigen Schritte automatisch aus. Nutzer können jederzeit eingreifen.

Sogenannte "Creative Skills" ermöglichen es, mehrstufige Abläufe mit einem einzigen Befehl zu starten, etwa die Anpassung eines Bildes für verschiedene Social-Media-Plattformen. Adobe plant zudem die Anbindung an Chat-Plattformen wie Anthropics Claude. Die öffentliche Beta des AI Assistant soll in den kommenden Wochen starten. Er basiert auf dem Vorprojekt "Project Moonlight", das auf der Adobe MAX vorgestellt wurde.

Zusätzlich erweitert Adobe Firefly um KI-Video- und Bildbearbeitung mit Audio-Optimierung, erweiterten Farbkontrollen und Bildanpassungen. Die Zahl der verfügbaren KI-Modelle wächst auf mehr als 30, neu dabei ist Kling 3.0.

Read full article about: OpenAI aktualisiert Agents-SDK mit neuer Sandbox-Unterstützung für sicherere KI-Agenten

OpenAI hat sein Agents-SDK umfassend aktualisiert. Das Software-Entwicklungskit hilft Programmierern, KI-Agenten zu bauen, die Dateien prüfen, Befehle ausführen, Code bearbeiten und längere Aufgaben in geschützten Umgebungen erledigen können. Es bündelt gängige Bausteine für Agenten-Systeme: Werkzeugnutzung über das Model Context Protocol (MCP), Code-Ausführung über ein Shell-Tool, Dateibearbeitung über ein Apply-Patch-Tool und eigene Anweisungen über AGENTS.md-Dateien. Eine Manifest-Funktion beschreibt den Arbeitsbereich und unterstützt neben lokalen Dateien auch Cloud-Speicher wie AWS S3, Google Cloud Storage und Azure Blob Storage.

Schematische Darstellung der Architektur des OpenAI Agents SDK mit Verbindungen zwischen Nutzereingabe, Modell, Tools und Orchestrierung.
Das Diagramm zeigt, wie das Agents-SDK Nutzereingaben, KI-Modelle und Werkzeuge verbindet, um KI-Agenten zu bauen. | Bild: OpenAI

Neu ist eine native Sandbox-Unterstützung: Agenten arbeiten in abgeschotteten Bereichen mit eigenen Dateien, Werkzeugen und Abhängigkeiten. Unterstützt werden Anbieter wie Cloudflare, Vercel, E2B, Modal und weitere. Entwickler können auch eigene Sandboxes einbinden. Die Trennung von Steuerungslogik und Rechenumgebung soll Sicherheit, Stabilität und Skalierbarkeit verbessern. Bei einem Ausfall kann der Agent seinen Zustand in einem neuen Container wiederherstellen. Die neuen Funktionen sind in Python verfügbar, TypeScript soll folgen. Es gelten die normalen API-Preise von OpenAI.

Read full article about: Google neues Gemini 3.1 Flash TTS-Modell macht KI-Stimmen flexibler und dynamischer

Google rollt sein neues Text-to-Speech-Modell basierend auf Gemini 3.1 Flash aus. Es bietet laut Google die bisher natürlichste und ausdrucksstärkste Sprachausgabe des Unternehmens. Neu sind sogenannte Audio-Tags: Entwickler können per Textbefehle Stil, Tempo, Tonfall und Akzent der Sprachausgabe steuern. Das Modell unterstützt mehr als 70 Sprachen und ermöglicht Dialoge mit mehreren Sprechern.

Auf der Rangliste von Artificial Analysis erreicht das Modell einen Elo-Wert von 1.211 und wird dort als besonders gutes Verhältnis von Qualität und Preis eingestuft. Bei der Qualität insgesamt liegt es vor Elevenlabs v3 und knapp hinter Inworld 1.5 Max.

Bild: Google

Gemini 3.1 Flash TTS bietet eine kostenlose Stufe, bei der Google die Daten zur Produktverbesserung nutzen darf. In der kostenpflichtigen Stufe kostet die Texteingabe 1,00 Dollar pro Million Token, die Audioausgabe 20,00 Dollar pro Million Token. Im Batch-Modus halbieren sich die Preise auf 0,50 Dollar (Texteingabe) und 10,00 Dollar (Audioausgabe). Bei der bezahlten Stufe werden die Daten nicht zur Produktverbesserung verwendet.

Gemini 3.1 Flash TTS ist ab sofort als Vorschau über die Gemini-API, Vertex AI für Unternehmen und Google Vids für Workspace-Nutzer verfügbar. Kostenlos testen kann man es in Googles AI Studio. Alle erzeugten Audiodateien werden mit Googles SynthID-Wasserzeichen versehen, um KI-generierte Inhalte erkennbar zu machen.

Read full article about: OpenAIs GPT-5.4 Pro löst offenbar eigenständig offenes Mathematikproblem Erdős #1196

OpenAIs Modell GPT-5.4 Pro hat offenbar das offene Mathematikproblem Erdős #1196 gelöst. Das Modell soll die Lösung in etwa 80 Minuten gefunden und in weiteren 30 Minuten als LaTeX-Arbeit aufbereitet haben. Eine formale Verifikation sei in Arbeit.

Der Mathematiker Terence Tao kommentierte im Erdős-Problems-Forum, die Arbeit zeige eine bisher nicht explizit beschriebene Verbindung zwischen der Anatomie ganzer Zahlen und der Theorie von Markov-Prozessen. Er bezeichnete das als sinnvollen Beitrag, der über die Lösung des einzelnen Problems hinausgehe. Kevin Barreto, der laut eigenen Angaben bald dem AI-for-Science-Team bei OpenAI beitreten wird, merkte im selben Forum an, die verwendete Markov-Ketten-Technik sei ein kreativer Schritt, den menschliche Mathematiker trotz langer Beschäftigung mit dem Problem übersehen hätten.

Die Diskussion ist insofern relevant, als bei LLMs gerade in der Mathematik immer wieder über deren Fähigkeit diskutiert wird, kreative Ansätze jenseits der beim Training gelernten Datenpunkte zu entwickeln. Sie zeigt, dass auch innerhalb bekannter Datenpunkte neues, aber noch nicht beschriebenes Wissen schlummern kann.

OpenAI-Präsident sieht radikalen Wandel durch KI und warnt vor disruptiven Folgen für Jobs

KI-Arbeit soll künftig nicht mehr bedeuten, sich an den Computer anzupassen. Der Computer passt sich an den Menschen an, sagt OpenAI-Präsident Greg Brockman. „Das ist disruptiv. Institutionen werden sich verändern.“

Read full article about: Google Chrome: Neue "Skills"-Funktion speichert häufig genutzte KI-Prompts

Google führt mit "Skills" eine neue Funktion in Chrome ein, mit der Nutzer häufig verwendete KI-Prompts speichern und per Klick wiederverwenden können. Bisher musste man denselben Prompt jedes Mal neu eingeben, etwa um Rezepte vegan umzuschreiben. Mit Skills lässt sich ein solcher Prompt direkt aus dem Chatverlauf speichern und über einen Schrägstrich ( / ) oder das Plus-Zeichen ( + ) in Gemini in Chrome aufrufen. Die Funktion arbeitet auch über mehrere Tabs hinweg. Google stellt zusätzlich eine Bibliothek mit fertigen Skills bereit, etwa für Produktvergleiche, Mahlzeitenplanung oder Geschenkauswahl. Nutzer können diese anpassen oder eigene erstellen.

Skills nutzen laut Google die bestehenden Sicherheits- und Datenschutzfunktionen von Chrome und fragen vor bestimmten Aktionen wie dem Versenden von E-Mails um Erlaubnis. Die Funktion ist ab sofort auf Mac, Windows und ChromeOS verfügbar, allerdings nur für Nutzer, deren Chrome-Sprache auf Englisch (US) eingestellt ist.

KI-Cybersecurity: Anthropics Claude Mythos kann autonom Unternehmensnetzwerke hacken

Das britische AI Security Institute, eine Behörde der britischen Regierung, hat Anthropics Claude Mythos Preview auf Cyber-Fähigkeiten getestet. Das Modell konnte erstmals eine vollständige Angriffssimulation auf ein Unternehmensnetzwerk autonom durchführen. Es gibt aber viele Einschränkungen.

Read full article about: OpenAI übernimmt KI-Finanz-Startup Hiro, das einen "persönlichen CFO" entwickelt hat

Das KI-Startup Hiro, das einen persönlichen KI-Finanzberater entwickelt hat, stellt seinen Dienst ein. Das Team wechselt zu OpenAI, zur Übernahmesumme sind keine Details bekannt.

Hiro ermöglichte Nutzern, Gehalt, Schulden und monatliche Ausgaben einzugeben. Das System berechnete daraus verschiedene Finanzszenarien und erklärte die Ergebnisse. Laut eigenen Angaben hat Hiro Kunden bei der Verwaltung von mehr als einer Milliarde Dollar an Vermögenswerten geholfen. Die Vision sei ein "persönlicher KI-CFO" (Chief Financial Officer).

Der Wechsel zu OpenAI gleicht einem sogenannten Acqui-Hire, also einer Übernahme, bei der es vor allem um das Team geht. Dafür spricht: Hiro nimmt keine neuen Anmeldungen mehr an, das Produkt wird am 20. April 2026 abgeschaltet. Nutzer können ihre Daten bis zum 13. Mai 2026 exportieren, danach werden alle persönlichen Daten gelöscht. Nutzerdaten werden nicht an OpenAI übertragen.

OpenAI arbeitet bereits seit einiger Zeit an einer eigenen Finanzlösung innerhalb von ChatGPT. Mit dem Hiro-Team könnte OpenAI diese Pläne nun schneller umsetzen.

OpenAIs neues KI-Modell "Spud" soll Grundlage für Super-App werden

OpenAIs Umsatzchefin Denise Dresser legt in einem internen Memo fünf strategische Prioritäten für das Enterprise-Geschäft dar. Darin finden sich interne Codenames für neue Produkte, eine Plattform-Strategie rund um KI-Agenten und der Vorwurf, Anthropic blähe seine Umsatzzahlen um Milliarden auf.