Anzeige
Short

OpenAI hat den "Developer Mode" für ChatGPT gestartet. Das neue Betafeature richtet sich an Plus- und Pro-Nutzer im Web und bietet vollen Zugriff auf MCP-Tools (Model Context Protocol), einschließlich Lese- und Schreibfunktionen.

Entwickler können damit eigene Remote-Server anbinden, Werkzeuge verwalten und direkt in Gesprächen nutzen. Unterstützt werden unter anderem OAuth-Authentifizierung, HTTP-Streaming und SSE. Die Einstellungen finden sich unter "Settings → Connectors → Advanced → Developer Mode".

"Es ist leistungsstark, aber auch gefährlich und ist für Entwickler gedacht, die wissen, wie man Connectoren sicher konfiguriert und testet."

OpenAI

OpenAI warnt vor Risiken wie Prompt-Injection, fehlerhaften Schreibvorgängen oder potenziell schädlichen Tools. Wenn ein eingebundener MCP-Server schädlich ist, kann er gezielt Informationen abgreifen oder manipulieren. Schreibaktionen benötigen eine gesonderte Bestätigung.

Short

Das Start-up Thinking Machines Lab hat analysiert, warum große Sprachmodelle auch bei identischen Fragen und Temperatur 0 (= immer die wahrscheinlichste Antwort) unterschiedliche Antworten liefern.

Trotz einer Temperatur von "0" schreibt Deepseek 3.1 bei derselben Anfrage unterschiedliche Antworten. | Bild: Thinking Machines

Laut Thinking Machines liegt die Ursache, wie oft vermutet, nicht allein an der Rechengenauigkeit von Grafikkarten, sondern daran, dass das Modell je nach Serverauslastung unterschiedlich rechnet. Das Team hat daher eigene Rechenwege entwickelt, damit Antworten unabhängig von der Auslastung immer gleichbleiben. Wenn solche deterministischen Ausgaben möglich würden, wäre das ein Fortschritt für verlässliche KI-Forschung, reproduzierbare Anwendungen in Unternehmen und vertrauenswürdige wissenschaftliche Auswertungen.

Short

Adobe integriert Googles neue Bild-KI als Option in Photoshop. Das Modell mit dem Kosenamen "Nano Banana" aka Gemini 2.5 Flash Image eignet sich insbesondere für die Bearbeitung bestehender Bilder mit hoher Konsistenz. Diesen Anwendungsfall zeigt Adobe auch in seinem ersten Werbevideo für die Integration des Modells für die Funktion "Generative Füllung", mit der sich Bildinhalte erweitern und ändern lassen. Das Modell soll im September starten.

Video: Adobe

Diese Option bieten zwar auch Adobes eigene Firefly-Bildmodelle, jedoch erreichen sie nicht dieselbe Qualität. Falls das jemand von Adobe liest: Als Publisher habe ich große Erfahrung damit, wie man allmählich seinen Umsatz an Big Tech verliert. Wenn ihr Fragen habt, meldet euch gern.

Anzeige
Anzeige
Short

Microsofts neues Sprachmodell MAI-Voice-1 ist nun in Copilot Labs verfügbar und erzeugt KI-Stimmen, die laut Microsoft-AI-Chef Mustafa Suleyman nicht nur sprechen, sondern "performen". Nutzer können zwischen drei Modi wählen: Emotive Mode für ausdrucksstarke Wiedergabe mit freier Textinterpretation, Story Mode für Geschichten mit mehreren Stimmen und Scripted Mode für wortgetreue Wiedergabe.

Video: Microsoft

Das Tool bietet verschiedene Stimmen und Stile – von Shakespeare bis Sportkommentar – und ist über Copilot Labs abrufbar. Microsoft hat mit MAI-1 kürzlich sein erstes großes Sprachmodell vorgestellt.

Anzeige
Anzeige
Anzeige
Anzeige
Short

Google hat sein KI-Tool NotebookLM um neue Berichtsfunktionen erweitert. Nutzer können jetzt strukturierte, professionell geschriebene Reports in über 80 Sprachen erstellen. Die Berichte lassen sich per Vorgabe von Ton, Stil und Aufbau anpassen.

Video: Google

Neu ist auch ein Blogpost-Format sowie dynamische Empfehlungen für passende Berichtstypen je nach hochgeladenen Quellen, etwa Whitepaper bei Forschungsdokumenten. Zudem können Nutzer eigene Prompts mit bis zu 1000 Wörtern definieren, um maßgeschneiderte Inhalte zu erzeugen.

Google News