Anzeige
Short

OpenAI hat den "Developer Mode" für ChatGPT gestartet. Das neue Betafeature richtet sich an Plus- und Pro-Nutzer im Web und bietet vollen Zugriff auf MCP-Tools (Model Context Protocol), einschließlich Lese- und Schreibfunktionen.

Entwickler können damit eigene Remote-Server anbinden, Werkzeuge verwalten und direkt in Gesprächen nutzen. Unterstützt werden unter anderem OAuth-Authentifizierung, HTTP-Streaming und SSE. Die Einstellungen finden sich unter "Settings → Connectors → Advanced → Developer Mode".

"Es ist leistungsstark, aber auch gefährlich und ist für Entwickler gedacht, die wissen, wie man Connectoren sicher konfiguriert und testet."

OpenAI

OpenAI warnt vor Risiken wie Prompt-Injection, fehlerhaften Schreibvorgängen oder potenziell schädlichen Tools. Wenn ein eingebundener MCP-Server schädlich ist, kann er gezielt Informationen abgreifen oder manipulieren. Schreibaktionen benötigen eine gesonderte Bestätigung.

Short

Das Start-up Thinking Machines Lab hat analysiert, warum große Sprachmodelle auch bei identischen Fragen und Temperatur 0 (= immer die wahrscheinlichste Antwort) unterschiedliche Antworten liefern.

Trotz einer Temperatur von "0" schreibt Deepseek 3.1 bei derselben Anfrage unterschiedliche Antworten. | Bild: Thinking Machines

Laut Thinking Machines liegt die Ursache, wie oft vermutet, nicht allein an der Rechengenauigkeit von Grafikkarten, sondern daran, dass das Modell je nach Serverauslastung unterschiedlich rechnet. Das Team hat daher eigene Rechenwege entwickelt, damit Antworten unabhängig von der Auslastung immer gleichbleiben. Wenn solche deterministischen Ausgaben möglich würden, wäre das ein Fortschritt für verlässliche KI-Forschung, reproduzierbare Anwendungen in Unternehmen und vertrauenswürdige wissenschaftliche Auswertungen.

Short

Adobe integriert Googles neue Bild-KI als Option in Photoshop. Das Modell mit dem Kosenamen "Nano Banana" aka Gemini 2.5 Flash Image eignet sich insbesondere für die Bearbeitung bestehender Bilder mit hoher Konsistenz. Diesen Anwendungsfall zeigt Adobe auch in seinem ersten Werbevideo für die Integration des Modells für die Funktion "Generative Füllung", mit der sich Bildinhalte erweitern und ändern lassen. Das Modell soll im September starten.

Video: Adobe

Diese Option bieten zwar auch Adobes eigene Firefly-Bildmodelle, jedoch erreichen sie nicht dieselbe Qualität. Falls das jemand von Adobe liest: Als Publisher habe ich große Erfahrung damit, wie man allmählich seinen Umsatz an Big Tech verliert. Wenn ihr Fragen habt, meldet euch gern.

Anzeige
Anzeige
Short

YouTube stellt die Funktion für mehrsprachige Tonspuren nun Millionen von YouTubern zur Verfügung. Dadurch können Videos direkt nach der Veröffentlichung in mehreren Sprachen gehört werden. In Tests kam über ein Viertel der Wiedergabezeit auf Sprachen, die nicht die Originalsprache des Videos waren. Creator wie Mark Rober nutzen inzwischen bis zu 30 Sprachversionen pro Video. Auch Jamie Oliver konnte seine Abrufzahlen damit deutlich steigern. Parallel dazu testet YouTube mehrsprachige Vorschaubilder. Diese Funktion war bisher nur im Rahmen eines Pilotprogramms nutzbar. Die Qualität der KI-Stimmen bleibt jedoch deutlich hinter dem aktuellen Stand der Technik zurück, den Unternehmen wie Elevenlabs oder Google mit dem NotebookLM-Podcastfeature bieten.

Anzeige
Anzeige
Short

OpenAI hat mit Oracle einen Cloud-Vertrag über 300 Milliarden US-Dollar abgeschlossen. Das berichtet das Wall Street Journal unter Berufung auf mit der Sache vertraute Personen. Der Fünfjahresdeal startet 2027 und zählt zu den größten Cloud-Vereinbarungen bisher. Der Vertrag umfasst laut dem WSJ Rechenkapazität im Umfang von 4,5 Gigawatt – das entspricht etwa dem Stromverbrauch von vier Millionen US-Haushalten. Oracle hatte in einer Mitteilung für das Quartal bis 31. August bekannt gegeben, Verträge im Wert von 317 Milliarden US-Dollar abgeschlossen zu haben. Laut WSJ stammt der Großteil davon aus dem OpenAI-Deal. OpenAI will mit dem Vertrag Rechenengpässe beheben, die die Entwicklung neuer KI-Modelle behindern. Oracle muss dafür voraussichtlich Schulden aufnehmen, um nötige Chips zu beschaffen. OpenAI hatte zuvor exklusiv mit Microsoft zusammengearbeitet, nutzt nun aber auch Oracle im Rahmen seines Infrastrukturprojekts „Stargate“.

Short

Microsofts neues Sprachmodell MAI-Voice-1 ist nun in Copilot Labs verfügbar und erzeugt KI-Stimmen, die laut Microsoft-AI-Chef Mustafa Suleyman nicht nur sprechen, sondern "performen". Nutzer können zwischen drei Modi wählen: Emotive Mode für ausdrucksstarke Wiedergabe mit freier Textinterpretation, Story Mode für Geschichten mit mehreren Stimmen und Scripted Mode für wortgetreue Wiedergabe.

Video: Microsoft

Das Tool bietet verschiedene Stimmen und Stile – von Shakespeare bis Sportkommentar – und ist über Copilot Labs abrufbar. Microsoft hat mit MAI-1 kürzlich sein erstes großes Sprachmodell vorgestellt.

Anzeige
Anzeige
Google News