YouTube stellt die Funktion für mehrsprachige Tonspuren nun Millionen von YouTubern zur Verfügung. Dadurch können Videos direkt nach der Veröffentlichung in mehreren Sprachen gehört werden. In Tests kam über ein Viertel der Wiedergabezeit auf Sprachen, die nicht die Originalsprache des Videos waren. Creator wie Mark Rober nutzen inzwischen bis zu 30 Sprachversionen pro Video. Auch Jamie Oliver konnte seine Abrufzahlen damit deutlich steigern. Parallel dazu testet YouTube mehrsprachige Vorschaubilder. Diese Funktion war bisher nur im Rahmen eines Pilotprogramms nutzbar. Die Qualität der KI-Stimmen bleibt jedoch deutlich hinter dem aktuellen Stand der Technik zurück, den Unternehmen wie Elevenlabs oder Google mit dem NotebookLM-Podcastfeature bieten.
OpenAI hat mit Oracle einen Cloud-Vertrag über 300 Milliarden US-Dollar abgeschlossen. Das berichtet das Wall Street Journal unter Berufung auf mit der Sache vertraute Personen. Der Fünfjahresdeal startet 2027 und zählt zu den größten Cloud-Vereinbarungen bisher. Der Vertrag umfasst laut dem WSJ Rechenkapazität im Umfang von 4,5 Gigawatt – das entspricht etwa dem Stromverbrauch von vier Millionen US-Haushalten. Oracle hatte in einer Mitteilung für das Quartal bis 31. August bekannt gegeben, Verträge im Wert von 317 Milliarden US-Dollar abgeschlossen zu haben. Laut WSJ stammt der Großteil davon aus dem OpenAI-Deal. OpenAI will mit dem Vertrag Rechenengpässe beheben, die die Entwicklung neuer KI-Modelle behindern. Oracle muss dafür voraussichtlich Schulden aufnehmen, um nötige Chips zu beschaffen. OpenAI hatte zuvor exklusiv mit Microsoft zusammengearbeitet, nutzt nun aber auch Oracle im Rahmen seines Infrastrukturprojekts „Stargate“.
Microsofts neues Sprachmodell MAI-Voice-1 ist nun in Copilot Labs verfügbar und erzeugt KI-Stimmen, die laut Microsoft-AI-Chef Mustafa Suleyman nicht nur sprechen, sondern "performen". Nutzer können zwischen drei Modi wählen: Emotive Mode für ausdrucksstarke Wiedergabe mit freier Textinterpretation, Story Mode für Geschichten mit mehreren Stimmen und Scripted Mode für wortgetreue Wiedergabe.
Video: Microsoft
Das Tool bietet verschiedene Stimmen und Stile – von Shakespeare bis Sportkommentar – und ist über Copilot Labs abrufbar. Microsoft hat mit MAI-1 kürzlich sein erstes großes Sprachmodell vorgestellt.
Bei einem Wochenend-Hackathon in San Francisco testeten über 100 Programmierer, ob sie KI-Tools beim Coden schlagen können. Die Veranstaltung "Man vs. Machine" teilte 37 Teams zufällig in "Mensch"- und "KI-unterstützte" Gruppen auf. Die Gewinner erhielten 12.500 Dollar Preisgeld und API-Credits von OpenAI und Anthropic. Das Forschungsunternehmen METR organisierte den Hackathon mit, nachdem eine eigene Studie ergeben hatte, dass KI-Tools erfahrene Entwickler um 19 Prozent verlangsamten. Im Finale waren beide Seiten gleich stark vertreten - drei Teams ohne KI und drei mit KI-Unterstützung. Das Gewinnerteam nutzte KI für ein Code-Review-Tool mit Heatmaps. Den zweiten Platz belegte ein Schreibwerkzeug für Autoren, das ohne KI entwickelt wurde.