Anzeige
Skip to content
Read full article about: Adobe stellt neuen Firefly AI Assistant für komplexe kreative Workflows vor

Adobe stellt den Firefly AI Assistant vor, einen neuen KI-Assistenten, der komplexe kreative Arbeitsabläufe über eine einzige Chat-Oberfläche steuert. Der Assistent verbindet Adobes Apps wie Photoshop, Illustrator, Premiere und Lightroom. Nutzer beschreiben in eigenen Worten, was sie erstellen wollen, und der Assistent führt die nötigen Schritte automatisch aus. Nutzer können jederzeit eingreifen.

Sogenannte "Creative Skills" ermöglichen es, mehrstufige Abläufe mit einem einzigen Befehl zu starten, etwa die Anpassung eines Bildes für verschiedene Social-Media-Plattformen. Adobe plant zudem die Anbindung an Chat-Plattformen wie Anthropics Claude. Die öffentliche Beta des AI Assistant soll in den kommenden Wochen starten. Er basiert auf dem Vorprojekt "Project Moonlight", das auf der Adobe MAX vorgestellt wurde.

Zusätzlich erweitert Adobe Firefly um KI-Video- und Bildbearbeitung mit Audio-Optimierung, erweiterten Farbkontrollen und Bildanpassungen. Die Zahl der verfügbaren KI-Modelle wächst auf mehr als 30, neu dabei ist Kling 3.0.

Read full article about: OpenAI aktualisiert Agents-SDK mit neuer Sandbox-Unterstützung für sicherere KI-Agenten

OpenAI hat sein Agents-SDK umfassend aktualisiert. Das Software-Entwicklungskit hilft Programmierern, KI-Agenten zu bauen, die Dateien prüfen, Befehle ausführen, Code bearbeiten und längere Aufgaben in geschützten Umgebungen erledigen können. Es bündelt gängige Bausteine für Agenten-Systeme: Werkzeugnutzung über das Model Context Protocol (MCP), Code-Ausführung über ein Shell-Tool, Dateibearbeitung über ein Apply-Patch-Tool und eigene Anweisungen über AGENTS.md-Dateien. Eine Manifest-Funktion beschreibt den Arbeitsbereich und unterstützt neben lokalen Dateien auch Cloud-Speicher wie AWS S3, Google Cloud Storage und Azure Blob Storage.

Schematische Darstellung der Architektur des OpenAI Agents SDK mit Verbindungen zwischen Nutzereingabe, Modell, Tools und Orchestrierung.
Das Diagramm zeigt, wie das Agents-SDK Nutzereingaben, KI-Modelle und Werkzeuge verbindet, um KI-Agenten zu bauen. | Bild: OpenAI

Neu ist eine native Sandbox-Unterstützung: Agenten arbeiten in abgeschotteten Bereichen mit eigenen Dateien, Werkzeugen und Abhängigkeiten. Unterstützt werden Anbieter wie Cloudflare, Vercel, E2B, Modal und weitere. Entwickler können auch eigene Sandboxes einbinden. Die Trennung von Steuerungslogik und Rechenumgebung soll Sicherheit, Stabilität und Skalierbarkeit verbessern. Bei einem Ausfall kann der Agent seinen Zustand in einem neuen Container wiederherstellen. Die neuen Funktionen sind in Python verfügbar, TypeScript soll folgen. Es gelten die normalen API-Preise von OpenAI.

Read full article about: Google neues Gemini 3.1 Flash TTS-Modell macht KI-Stimmen flexibler und dynamischer

Google rollt sein neues Text-to-Speech-Modell basierend auf Gemini 3.1 Flash aus. Es bietet laut Google die bisher natürlichste und ausdrucksstärkste Sprachausgabe des Unternehmens. Neu sind sogenannte Audio-Tags: Entwickler können per Textbefehle Stil, Tempo, Tonfall und Akzent der Sprachausgabe steuern. Das Modell unterstützt mehr als 70 Sprachen und ermöglicht Dialoge mit mehreren Sprechern.

Auf der Rangliste von Artificial Analysis erreicht das Modell einen Elo-Wert von 1.211 und wird dort als besonders gutes Verhältnis von Qualität und Preis eingestuft. Bei der Qualität insgesamt liegt es vor Elevenlabs v3 und knapp hinter Inworld 1.5 Max.

Bild: Google

Gemini 3.1 Flash TTS bietet eine kostenlose Stufe, bei der Google die Daten zur Produktverbesserung nutzen darf. In der kostenpflichtigen Stufe kostet die Texteingabe 1,00 Dollar pro Million Token, die Audioausgabe 20,00 Dollar pro Million Token. Im Batch-Modus halbieren sich die Preise auf 0,50 Dollar (Texteingabe) und 10,00 Dollar (Audioausgabe). Bei der bezahlten Stufe werden die Daten nicht zur Produktverbesserung verwendet.

Gemini 3.1 Flash TTS ist ab sofort als Vorschau über die Gemini-API, Vertex AI für Unternehmen und Google Vids für Workspace-Nutzer verfügbar. Kostenlos testen kann man es in Googles AI Studio. Alle erzeugten Audiodateien werden mit Googles SynthID-Wasserzeichen versehen, um KI-generierte Inhalte erkennbar zu machen.

Anthropic bereitet Opus 4.7 und KI-Design-Tool vor, VCs bieten bis zu 800 Milliarden Dollar

Anthropic plant die Veröffentlichung eines neuen Modells und eines Design-Tools, das Adobe und Figma Konkurrenz machen soll. Gleichzeitig überbieten sich Risikokapitalgeber mit Bewertungsangeboten.

Read full article about: Microsoft Copilot in Word kann jetzt Änderungen nachverfolgen und Kommentare verwalten

Microsoft erweitert Copilot in Word um neue Funktionen, die sich laut dem Unternehmen an Fachleute aus den Bereichen Recht, Finanzen und Compliance richten. Copilot kann nun Änderungen auf Wortebene nachverfolgen (Track Changes), sodass Bearbeitungen transparent und prüfbar bleiben. Außerdem lassen sich Kommentare direkt im Text verwalten, Inhaltsverzeichnisse einfügen und Kopf- sowie Fußzeilen mit dynamischen Feldern wie Seitenzahlen anlegen.

Bei mehrstufigen Bearbeitungen zeigt Copilot in Echtzeit an, woran es gerade arbeitet. Laut Microsoft basieren die Funktionen auf "Work IQ", einer Ebene, die Antworten an den jeweiligen Nutzer und dessen Organisation anpasst. Die Daten bleiben innerhalb der Microsoft-365-Sicherheitsgrenzen. Die neuen Funktionen sind zunächst nur auf dem Windows-Desktop über das Frontier-Programm im Office Insiders Beta-Channel verfügbar. Versionen für Web und Mac sollen folgen.

Read full article about: OpenAIs GPT-5.4 Pro löst offenbar eigenständig offenes Mathematikproblem Erdős #1196

OpenAIs Modell GPT-5.4 Pro hat offenbar das offene Mathematikproblem Erdős #1196 gelöst. Das Modell soll die Lösung in etwa 80 Minuten gefunden und in weiteren 30 Minuten als LaTeX-Arbeit aufbereitet haben. Eine formale Verifikation sei in Arbeit.

Der Mathematiker Terence Tao kommentierte im Erdős-Problems-Forum, die Arbeit zeige eine bisher nicht explizit beschriebene Verbindung zwischen der Anatomie ganzer Zahlen und der Theorie von Markov-Prozessen. Er bezeichnete das als sinnvollen Beitrag, der über die Lösung des einzelnen Problems hinausgehe. Kevin Barreto, der laut eigenen Angaben bald dem AI-for-Science-Team bei OpenAI beitreten wird, merkte im selben Forum an, die verwendete Markov-Ketten-Technik sei ein kreativer Schritt, den menschliche Mathematiker trotz langer Beschäftigung mit dem Problem übersehen hätten.

Die Diskussion ist insofern relevant, als bei LLMs gerade in der Mathematik immer wieder über deren Fähigkeit diskutiert wird, kreative Ansätze jenseits der beim Training gelernten Datenpunkte zu entwickeln. Sie zeigt, dass auch innerhalb bekannter Datenpunkte neues, aber noch nicht beschriebenes Wissen schlummern kann.

OpenAI bringt spezielles Cyber-Sicherheitsmodell heraus und weitet Zugang für Verteidiger aus

OpenAI veröffentlicht mit GPT-5.4-Cyber ein Modell, das gezielt für defensive Cybersicherheit trainiert wurde. Der Zugang bleibt vorerst auf verifizierte Sicherheitsexperten beschränkt.

Read full article about: Google Chrome: Neue "Skills"-Funktion speichert häufig genutzte KI-Prompts

Google führt mit "Skills" eine neue Funktion in Chrome ein, mit der Nutzer häufig verwendete KI-Prompts speichern und per Klick wiederverwenden können. Bisher musste man denselben Prompt jedes Mal neu eingeben, etwa um Rezepte vegan umzuschreiben. Mit Skills lässt sich ein solcher Prompt direkt aus dem Chatverlauf speichern und über einen Schrägstrich ( / ) oder das Plus-Zeichen ( + ) in Gemini in Chrome aufrufen. Die Funktion arbeitet auch über mehrere Tabs hinweg. Google stellt zusätzlich eine Bibliothek mit fertigen Skills bereit, etwa für Produktvergleiche, Mahlzeitenplanung oder Geschenkauswahl. Nutzer können diese anpassen oder eigene erstellen.

Skills nutzen laut Google die bestehenden Sicherheits- und Datenschutzfunktionen von Chrome und fragen vor bestimmten Aktionen wie dem Versenden von E-Mails um Erlaubnis. Die Funktion ist ab sofort auf Mac, Windows und ChromeOS verfügbar, allerdings nur für Nutzer, deren Chrome-Sprache auf Englisch (US) eingestellt ist.

Read full article about: Claude Code bekommt Routines für wiederkehrende Entwickleraufgaben

Anthropic hat für Claude Code sogenannte "Routines" vorgestellt, also automatisierte Abläufe, die eigenständig Fehler beheben, Pull Requests prüfen oder auf Ereignisse reagieren können. Routines werden einmal konfiguriert und laufen dann zeitgesteuert, per API-Aufruf oder als Reaktion auf GitHub-Ereignisse auf Anthropics Web-Infrastruktur, unabhängig vom eigenen Rechner.

Typische Anwendungen sind etwa das nächtliche Sortieren und Zuweisen neuer Fehlerberichte, automatische Code-Reviews nach teamspezifischen Checklisten, das Portieren von Änderungen zwischen Programmiersprachen oder das Prüfen von Deployments auf Fehler. Routines greifen auf bestehende Repository-Anbindungen und Konnektoren zu. Die Funktion ist als Forschungsvorschau für die Tarife Pro, Max, Team und Enterprise verfügbar, mit täglichen Limits von 5 bis 25 Ausführungen je nach Plan. Weitere Webhook-Quellen neben GitHub sollen folgen.

Screenshot der Claude Code Oberfläche zum Erstellen einer neuen Routine mit Feldern für Name und Aufgabenbeschreibung, Modellauswahl Opus 4.6, einem verknüpften Repository, drei Trigger-Optionen (Schedule, GitHub event, API) sowie Konnektoren für Slack und Asana.
Nutzer vergeben einen Namen, beschreiben die Aufgabe, wählen einen Trigger (Zeitplan, GitHub-Event oder API) und verbinden externe Dienste wie Slack oder Asana.

Zuletzt erhielt die Desktop-Version Funktionen, mit denen Claude Code Entwicklungsserver starten, Web-Apps anzeigen und Fehler selbstständig beheben kann. Kurz darauf folgte der /loop-Befehl für lokale, zeitgesteuerte Aufgaben, die im Hintergrund auf dem eigenen Rechner laufen. Mit Routines verlagert Anthropic diese Automatisierung nun in die Cloud.

Ukrainische Bodenroboter erobern erstmals feindliche Stellung ohne einen einzigen Soldaten

Präsident Zelenskyy verkündet einen historischen Meilenstein: Eine russische Position wurde ausschließlich von unbemannten Systemen eingenommen. Ein CSIS-Bericht zeigt, wie KI die ukrainische Kriegsführung bereits verändert und wo (noch) die Grenzen liegen.