Anzeige
Short

Robby Walker, einer der ranghöchsten KI-Manager von Apple, verlässt das Unternehmen im kommenden Monat, berichtet Bloomberg. Walker war bis Anfang des Jahres für Siri verantwortlich, bevor die Zuständigkeit an Softwarechef Craig Federighi überging. Danach leitete er Projekte für eine neue KI-gestützte Websuche, die 2026 starten und mit Diensten wie ChatGPT oder Perplexity konkurrieren soll. Zuletzt leitete er Apples „Answers, Information and Knowledge“-Team. Sein Abschied reiht sich in weitere Abgänge aus der KI-Sparte ein, darunter Ruoming Pang und Frank Chu, die zu Meta wechselten.

Short

Nvidia zieht sich teilweise aus dem direkten Wettbewerb mit Cloudanbietern wie Amazon Web Services zurück und nutzt seinen GPU-Cloud-Dienst DGX Cloud künftig vor allem für die eigene Forschung, berichtet The Information. Bisher sollten Banken, Pharmafirmen und andere Unternehmen Rechenleistung direkt über Nvidia buchen können. Laut Insidern blieb die Nachfrage jedoch gering, auch wegen höherer Preise im Vergleich zu klassischen Cloud-Anbietern. Nvidia investierte rund 13 Milliarden Dollar, um eigene Chips von AWS und anderen großen Clouds zurückzumieten und diese teilweise an Kunden wie Amgen oder ServiceNow weiterzugeben. Offiziell bestreitet Nvidia einen Strategiewechsel: DGX Cloud sei ausgebucht und werde weiter ausgebaut, sagte Managerin Alexis Black Bjorlin. Parallel hat Nvidia mit DGX Cloud Lepton einen Marktplatz gestartet, über den Cloudprovider ihre GPU-Kapazitäten anbieten können.

Short

OpenAI hat den "Developer Mode" für ChatGPT gestartet. Das neue Betafeature richtet sich an Plus- und Pro-Nutzer im Web und bietet vollen Zugriff auf MCP-Tools (Model Context Protocol), einschließlich Lese- und Schreibfunktionen.

Entwickler können damit eigene Remote-Server anbinden, Werkzeuge verwalten und direkt in Gesprächen nutzen. Unterstützt werden unter anderem OAuth-Authentifizierung, HTTP-Streaming und SSE. Die Einstellungen finden sich unter "Settings → Connectors → Advanced → Developer Mode".

"Es ist leistungsstark, aber auch gefährlich und ist für Entwickler gedacht, die wissen, wie man Connectoren sicher konfiguriert und testet."

OpenAI

OpenAI warnt vor Risiken wie Prompt-Injection, fehlerhaften Schreibvorgängen oder potenziell schädlichen Tools. Wenn ein eingebundener MCP-Server schädlich ist, kann er gezielt Informationen abgreifen oder manipulieren. Schreibaktionen benötigen eine gesonderte Bestätigung.

Anzeige
Anzeige
Short

Das Start-up Thinking Machines Lab hat analysiert, warum große Sprachmodelle auch bei identischen Fragen und Temperatur 0 (= immer die wahrscheinlichste Antwort) unterschiedliche Antworten liefern.

Trotz einer Temperatur von "0" schreibt Deepseek 3.1 bei derselben Anfrage unterschiedliche Antworten. | Bild: Thinking Machines

Laut Thinking Machines liegt die Ursache, wie oft vermutet, nicht allein an der Rechengenauigkeit von Grafikkarten, sondern daran, dass das Modell je nach Serverauslastung unterschiedlich rechnet. Das Team hat daher eigene Rechenwege entwickelt, damit Antworten unabhängig von der Auslastung immer gleichbleiben. Wenn solche deterministischen Ausgaben möglich würden, wäre das ein Fortschritt für verlässliche KI-Forschung, reproduzierbare Anwendungen in Unternehmen und vertrauenswürdige wissenschaftliche Auswertungen.

Short

Adobe integriert Googles neue Bild-KI als Option in Photoshop. Das Modell mit dem Kosenamen "Nano Banana" aka Gemini 2.5 Flash Image eignet sich insbesondere für die Bearbeitung bestehender Bilder mit hoher Konsistenz. Diesen Anwendungsfall zeigt Adobe auch in seinem ersten Werbevideo für die Integration des Modells für die Funktion "Generative Füllung", mit der sich Bildinhalte erweitern und ändern lassen. Das Modell soll im September starten.

Video: Adobe

Diese Option bieten zwar auch Adobes eigene Firefly-Bildmodelle, jedoch erreichen sie nicht dieselbe Qualität. Falls das jemand von Adobe liest: Als Publisher habe ich große Erfahrung damit, wie man allmählich seinen Umsatz an Big Tech verliert. Wenn ihr Fragen habt, meldet euch gern.

Short

YouTube stellt die Funktion für mehrsprachige Tonspuren nun Millionen von YouTubern zur Verfügung. Dadurch können Videos direkt nach der Veröffentlichung in mehreren Sprachen gehört werden. In Tests kam über ein Viertel der Wiedergabezeit auf Sprachen, die nicht die Originalsprache des Videos waren. Creator wie Mark Rober nutzen inzwischen bis zu 30 Sprachversionen pro Video. Auch Jamie Oliver konnte seine Abrufzahlen damit deutlich steigern. Parallel dazu testet YouTube mehrsprachige Vorschaubilder. Diese Funktion war bisher nur im Rahmen eines Pilotprogramms nutzbar. Die Qualität der KI-Stimmen bleibt jedoch deutlich hinter dem aktuellen Stand der Technik zurück, den Unternehmen wie Elevenlabs oder Google mit dem NotebookLM-Podcastfeature bieten.

Anzeige
Anzeige
Short

OpenAI hat mit Oracle einen Cloud-Vertrag über 300 Milliarden US-Dollar abgeschlossen. Das berichtet das Wall Street Journal unter Berufung auf mit der Sache vertraute Personen. Der Fünfjahresdeal startet 2027 und zählt zu den größten Cloud-Vereinbarungen bisher. Der Vertrag umfasst laut dem WSJ Rechenkapazität im Umfang von 4,5 Gigawatt – das entspricht etwa dem Stromverbrauch von vier Millionen US-Haushalten. Oracle hatte in einer Mitteilung für das Quartal bis 31. August bekannt gegeben, Verträge im Wert von 317 Milliarden US-Dollar abgeschlossen zu haben. Laut WSJ stammt der Großteil davon aus dem OpenAI-Deal. OpenAI will mit dem Vertrag Rechenengpässe beheben, die die Entwicklung neuer KI-Modelle behindern. Oracle muss dafür voraussichtlich Schulden aufnehmen, um nötige Chips zu beschaffen. OpenAI hatte zuvor exklusiv mit Microsoft zusammengearbeitet, nutzt nun aber auch Oracle im Rahmen seines Infrastrukturprojekts „Stargate“.

Anzeige
Anzeige
Short

Microsofts neues Sprachmodell MAI-Voice-1 ist nun in Copilot Labs verfügbar und erzeugt KI-Stimmen, die laut Microsoft-AI-Chef Mustafa Suleyman nicht nur sprechen, sondern "performen". Nutzer können zwischen drei Modi wählen: Emotive Mode für ausdrucksstarke Wiedergabe mit freier Textinterpretation, Story Mode für Geschichten mit mehreren Stimmen und Scripted Mode für wortgetreue Wiedergabe.

Video: Microsoft

Das Tool bietet verschiedene Stimmen und Stile – von Shakespeare bis Sportkommentar – und ist über Copilot Labs abrufbar. Microsoft hat mit MAI-1 kürzlich sein erstes großes Sprachmodell vorgestellt.

Google News