Jonathan Kemper

29. Januar 2026

Google arbeitet an einer Funktion, mit der Nutzer ihre eigene Stimme in AI Studio klonen können. Eine versteckte Option namens "Create Your Voice" erscheint laut TestingCatalog bei der Auswahl des "Flash Native Audio Preview"-Modells, das derzeit mit Gemini 2.5 Flash verbunden ist. Bei Auswahl öffnet sich ein Fenster zum Aufnehmen und Hochladen von Audio, die Funktion ist aber noch nicht aktiv. Die Entdeckung deutet darauf hin, dass Google native Audio-Fähigkeiten für Gemini 3 Flash vorbereitet. Damit könnten Entwickler künstliche Stimmen erzeugen, die auf aufgenommenen Sprachproben basieren. Google hatte erst im Dezember 2025 ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das die Sprachqualität verbesserte und Anweisungen präziser umsetzt.

Screenshot von Google AI Studio im Playground-Modus. Rechts in der Seitenleiste ist unter der Stimmauswahl "Zephyr" ein Button mit der Aufschrift "Create your voice" zu sehen, auf den ein roter Pfeil zeigt. Oben rechts steht die Modellbezeichnung Gemini 2.5 Flash Native Audio Preview. — Die versteckte Option "Create your voice" in Google AI Studio deutet auf kommende Funktionen zum Klonen von Stimmen hin.

Zusätzlich wurde eine neue Option gefunden, mit der sich ganze Code-Sammlungen über GitHub-Repositories importieren lassen. Auch die Startseite wird allem Anschein nach überarbeitet und zeigt künftig Aktivitäten und Nutzungsstatistiken getrennt an.

Kommentieren Quelle: TestingCatalog

Jonathan Kemper

29. Januar 2026

Praxis

KI-"Auto Browse" in Chrome soll Reisen buchen, Formulare füllen und Termine verwalten

Jonathan Kemper

28. Januar 2026

Forschung

Chinesisches KI-Unternehmen Moonshot AI will mit Agenten-Schwärmen die Konkurrenz überholen

Moonshot AI hat Kimi K2.5 veröffentlicht, das laut eigenen Angaben leistungsstärkste Open-Weight-Modell. Das Modell kann eigenständig bis zu 100 KI-Agenten koordinieren, die parallel an komplexen Aufgaben arbeiten.

Vollständigen Artikel lesen

Kommentieren

Jonathan Kemper

27. Januar 2026

Short News

Die britische Regierung hat Anthropic ausgewählt, einen KI-Assistenten für die Website GOV.UK zu entwickeln. Das Ministerium für Wissenschaft, Innovation und Technologie (DSIT) will damit Bürgern helfen, staatliche Dienste zu nutzen und individuelle Beratung zu erhalten. Zunächst sollen Arbeitssuchende bei ihrer Karriere beraten werden, leichteren Zugang zu Weiterbildungen erhalten und Angebote erklärt bekommen.

Die Partnerschaft baut auf einer Absichtserklärung vom Februar 2025 auf. Anthropic-Ingenieure arbeiten mit britischen Beamten zusammen, damit die Regierung das System künftig eigenständig betreiben kann. Nutzer sollen die volle Kontrolle über ihre Daten behalten und sich jederzeit abmelden können.

Regionschefin Pip White von Anthropic betonte, die Zusammenarbeit zeige, wie KI sicher für das Gemeinwohl eingesetzt werden könne. Neben Anthropic sind auch andere US-Konzerne stark in Großbritannien verwurzelt: Microsoft, OpenAI und Nvidia haben letztes Jahr Investitionen von über 31 Milliarden Pfund für britische KI-Infrastruktur zugesagt. Im Gegensatz zu OpenAI, das einen 200-Millionen-Dollar-Vertrag mit dem US-Verteidigungsministerium abgeschlossen hat, untersagt Anthropic US-Strafverfolgungsbehörden die Nutzung seiner Modelle für Inlandsüberwachung.

Kommentieren Quelle: Anthropic

Jonathan Kemper

26. Januar 2026

Praxis

Nvidias offene Sprach-KI PersonaPlex kombiniert schnelle Reaktionen mit flexiblen Persönlichkeiten

Jonathan Kemper

25. Januar 2026

Praxis

Führende KI-Chatbots können ihre eigenen Fake-Videos nicht zuverlässig identifizieren

Retro-Illustration: Ein alter Röhrenfernseher in einer bunten Collage mit Glitch-Effekten und Pop-Art-Elementen.

Jonathan Kemper

25. Januar 2026

Praxis

Anthropic veröffentlicht neue Verfassung für Claude und räumt Unsicherheit über KI-Bewusstsein ein

Illustration: Eine Pergamentrolle mit einem neuronalen Netzwerk-Symbol und einer Schreibfeder auf grünem Hintergrund.

Jonathan Kemper

24. Januar 2026

Forschung

KI-Modelle lassen sich laut Apple-Forschern schlechter steuern als angenommen

Jonathan Kemper

24. Januar 2026

Forschung

X-Coder übertrifft deutlich größere KI-Modelle dank rein synthetischer Trainingsdaten

Wer braucht schon echte Daten? Forscher zeigen, dass ein KI-Modell mit rein synthetischen Programmieraufgaben trainiert werden kann und dabei größere Konkurrenten schlägt. Mehr Aufgaben schlagen mehr Lösungen.

Vollständigen Artikel lesen

Kommentieren

Jonathan Kemper

22. Januar 2026

Short News

Baidus KI-Modell Ernie 5.0, das Text, Bilder, Audio und Video in einer einheitlichen Architektur verarbeitet, ist jetzt offiziell verfügbar. Laut dem LMArena-Ranking vom 15. Januar 2026 erreichte Ernie-5.0-0110 einen Score von 1.460 Punkten und belegte damit Platz 8 weltweit sowie Platz 1 unter allen chinesischen Modellen, gleichauf mit dem etwas älteren OpenAI-Modell GPT-5.1 (High) und vor Googles Gemini 2.5 Pro sowie Anthropics Claude Sonnet 4.5. Das nächstbeste Modell aus China ist GLM-4.7 von Zhipu AI. In der Kategorie Mathematik landet Ernie 5.0 auf Platz 2 weltweit, nur hinter GPT 5.2 (High).

LM-Arena-Ranking: Baidu Ernie-5.0-0110 belegt Platz 8 mit 1460 Punkten in Textbenchmarks der Top 10. — Das LMArena-Ranking ermittelt sich aus zahlreichen anonymen Paarvergleichen, bei denen Nutzer die bessere Modellantwort wählen.

Das Modell nutzt eine Mixture-of-Experts-Architektur mit rund 2,4 Billionen Parametern, wobei pro Anfrage weniger als 3 Prozent aktiv sind. Das Modell ist bislang nur unter ernie.baidu.com zugänglich, im Gegensatz zu früheren Ausgaben hat Baidu bislang keine Gewichte veröffentlicht. Ein technischer Report oder nähere Details zur Funktionsweise stehen ebenfalls noch aus. Zuletzt hatte Baidu mit Ernie-4.5-VL-28B-A3B-Thinking ein offenes Modell herausgebracht, das Bilder während des Denkprozesses bearbeiten kann, etwa heranzoomen, um Text besser zu lesen.

Kommentieren Quelle: Baidu via X