Themen Hub KI in der Praxis
Künstliche Intelligenz ist im Alltag gegenwärtig – vom „Googeln“ über Gesichtserkennung bis zum Staubsaugerroboter. KI-Werkzeuge werden immer elaborierter und unterstützen Menschen und Unternehmen effektiver bei ihren Aufgaben, etwa bei der Generierung von Grafiken, beim Texten oder Coden oder bei der Interpretation großer Datenmengen.
Welche KI-Werkzeuge gibt es, wie funktionieren sind, wie helfen sie im Alltag – und wie verändern sie unser Leben? Mit diesen Fragen befassen wir uns in der Rubrik Künstliche Intelligenz in der Praxis.
"Wenn du effektiv kommunizieren kannst, kannst du programmieren", sagt Sean Grove, Alignment-Forscher bei OpenAI. Grove argumentiert, dass es in der Softwareentwicklung nie nur um Code ging, sondern um strukturierte Kommunikation: Anforderungen verstehen, Ziele definieren und sie für Menschen und Maschinen verständlich formulieren.
Code sei nur eine "verlustbehaftete Projektion" der ursprünglichen Absicht und Werte. Die Fähigkeit, diese Absicht präzise in Spezifikationen und Prompts zu gießen, werde angesichts immer leistungsfähigerer KI-Modelle zur Schlüsselkompetenz.
"Wer die Spezifikation schreibt, sei es ein Produktmanager, ein Gesetzgeber, ein Ingenieur oder ein Marketer, ist jetzt der Programmierer", so Sean.
Mistral AI und All Hands AI haben zwei neue Modelle für KI-gestützte Programmieragenten veröffentlicht: Devstral Small 1.1 und Devstral Medium. Devstral Small 1.1 ist Open Source, läuft lokal auf einer RTX 4090 oder einem Mac mit 32 GB RAM und erreicht 53,6 % im SWE-Bench Verified Test. Es unterstützt XML und andere Formate.

Devstral Medium erzielt 61,6 % im gleichen Test und soll laut Mistral leistungsfähiger und günstiger sein als Gemini 2.5 Pro und GPT-4.1. Es lässt sich über die API nutzen und kann feingetunt werden. Es soll demnächst in Mistral Code integriert werden.
Google stellt auf dem Cloud Summit in London neue Funktionen für Firebase Studio vor. Dazu gehören drei "Agent"-Modi für Gemini 2.5: ein Gesprächsmodus ("Ask"), ein unterstützender Modus mit Nutzerfreigabe ("Agent") und ein autonomer Modus ("Agent Auto-run"), der eigenständig Code schreiben und ändern kann. Alle Modi berücksichtigen laut Google projektspezifische Regeln und erfordern bei sicherheitsrelevanten Vorgängen eine Freigabe. Zusätzlich unterstützt Firebase Studio nun das Model Context Protocol (MCP) zur Integration externer Datenquellen und bietet eine direkte Integration der Gemini-Befehlszeile (CLI) für Aufgaben wie Debugging oder Codeverwaltung im Terminal.
Im neuen Auto-Mode soll Firebase Studio eigenständig Apps generieren oder zu existierenden Apps Features hinzufügen. | Video: Google
Google hat seiner KI-Video-App Veo 3 eine neue Funktion hinzugefügt, mit der sich aus einem Bild ein kurzes Video erzeugen lässt. Nutzer mit Pro- oder Ultra-Abo können in der Gemini-App oder unter gemini.google ein Bild hochladen, „Video“ in der Eingabeleiste auswählen und per Texteingabe beschreiben, was im Clip passieren soll. Laut Google rollt die Funktion ab heute aus – ob sie bereits verfügbar ist, kann direkt in der App geprüft werden.
✨📦✨ Special delivery! A new Gemini feature just dropped. Make photos come alive by turning them into videos with sound.
— Google Gemini App (@GeminiApp) July 10, 2025
Condé Nast und Hearst haben mit Amazon mehrjährige Lizenzverträge geschlossen, um Inhalte für den KI-Shoppingassistenten Rufus bereitzustellen. Die Vereinbarungen betreffen unter anderem Titel wie Good Housekeeping, Cosmopolitan und Harper's Bazaar. Condé Nast bestätigte ebenfalls eine Lizenzpartnerschaft. Bereits im Mai hatte die New York Times eine ähnliche Kooperation mit Amazon bekannt gegeben, die auch Inhalte von NYT Cooking und The Athletic umfasst. Die finanziellen Details der neuen Deals wurden nicht veröffentlicht. Erste Inhalte sollen im Sommer in Rufus integriert werden. Rufus ist Amazons KI-gestützter Einkaufsassistent, der auf dem Produktkatalog von Amazon sowie Webinformationen basiert und Nutzern bei Kaufentscheidungen helfen soll.