Anzeige
Skip to content

Jonathan Kemper

Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Read full article about: Google bereitet wohl native Audio-Fähigkeiten für Gemini 3 Flash mit Stimmenklonen vor

Google arbeitet an einer Funktion, mit der Nutzer ihre eigene Stimme in AI Studio klonen können. Eine versteckte Option namens "Create Your Voice" erscheint laut TestingCatalog bei der Auswahl des "Flash Native Audio Preview"-Modells, das derzeit mit Gemini 2.5 Flash verbunden ist. Bei Auswahl öffnet sich ein Fenster zum Aufnehmen und Hochladen von Audio, die Funktion ist aber noch nicht aktiv. Die Entdeckung deutet darauf hin, dass Google native Audio-Fähigkeiten für Gemini 3 Flash vorbereitet. Damit könnten Entwickler künstliche Stimmen erzeugen, die auf aufgenommenen Sprachproben basieren. Google hatte erst im Dezember 2025 ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das die Sprachqualität verbesserte und Anweisungen präziser umsetzt.

Screenshot von Google AI Studio im Playground-Modus. Rechts in der Seitenleiste ist unter der Stimmauswahl "Zephyr" ein Button mit der Aufschrift "Create your voice" zu sehen, auf den ein roter Pfeil zeigt. Oben rechts steht die Modellbezeichnung Gemini 2.5 Flash Native Audio Preview.
Die versteckte Option "Create your voice" in Google AI Studio deutet auf kommende Funktionen zum Klonen von Stimmen hin.

Zusätzlich wurde eine neue Option gefunden, mit der sich ganze Code-Sammlungen über GitHub-Repositories importieren lassen. Auch die Startseite wird allem Anschein nach überarbeitet und zeigt künftig Aktivitäten und Nutzungsstatistiken getrennt an.

Chinesisches KI-Unternehmen Moonshot AI will mit Agenten-Schwärmen die Konkurrenz überholen

Moonshot AI hat Kimi K2.5 veröffentlicht, das laut eigenen Angaben leistungsstärkste Open-Weight-Modell. Das Modell kann eigenständig bis zu 100 KI-Agenten koordinieren, die parallel an komplexen Aufgaben arbeiten.

Read full article about: UK-Regierung will mit Anthropic-KI Bürgern bei der Jobsuche helfen

Die britische Regierung hat Anthropic ausgewählt, einen KI-Assistenten für die Website GOV.UK zu entwickeln. Das Ministerium für Wissenschaft, Innovation und Technologie (DSIT) will damit Bürgern helfen, staatliche Dienste zu nutzen und individuelle Beratung zu erhalten. Zunächst sollen Arbeitssuchende bei ihrer Karriere beraten werden, leichteren Zugang zu Weiterbildungen erhalten und Angebote erklärt bekommen.

Die Partnerschaft baut auf einer Absichtserklärung vom Februar 2025 auf. Anthropic-Ingenieure arbeiten mit britischen Beamten zusammen, damit die Regierung das System künftig eigenständig betreiben kann. Nutzer sollen die volle Kontrolle über ihre Daten behalten und sich jederzeit abmelden können.

Regionschefin Pip White von Anthropic betonte, die Zusammenarbeit zeige, wie KI sicher für das Gemeinwohl eingesetzt werden könne. Neben Anthropic sind auch andere US-Konzerne stark in Großbritannien verwurzelt: Microsoft, OpenAI und Nvidia haben letztes Jahr Investitionen von über 31 Milliarden Pfund für britische KI-Infrastruktur zugesagt. Im Gegensatz zu OpenAI, das einen 200-Millionen-Dollar-Vertrag mit dem US-Verteidigungsministerium abgeschlossen hat, untersagt Anthropic US-Strafverfolgungsbehörden die Nutzung seiner Modelle für Inlandsüberwachung.

X-Coder übertrifft deutlich größere KI-Modelle dank rein synthetischer Trainingsdaten

Wer braucht schon echte Daten? Forscher zeigen, dass ein KI-Modell mit rein synthetischen Programmieraufgaben trainiert werden kann und dabei größere Konkurrenten schlägt. Mehr Aufgaben schlagen mehr Lösungen.

Read full article about: Baidus neues Modell Ernie 5.0 hat 2,4 Billionen Parameter und ist chinesisches Top-Modell in LMArena

Baidus KI-Modell Ernie 5.0, das Text, Bilder, Audio und Video in einer einheitlichen Architektur verarbeitet, ist jetzt offiziell verfügbar. Laut dem LMArena-Ranking vom 15. Januar 2026 erreichte Ernie-5.0-0110 einen Score von 1.460 Punkten und belegte damit Platz 8 weltweit sowie Platz 1 unter allen chinesischen Modellen, gleichauf mit dem etwas älteren OpenAI-Modell GPT-5.1 (High) und vor Googles Gemini 2.5 Pro sowie Anthropics Claude Sonnet 4.5. Das nächstbeste Modell aus China ist GLM-4.7 von Zhipu AI. In der Kategorie Mathematik landet Ernie 5.0 auf Platz 2 weltweit, nur hinter GPT 5.2 (High).

LM-Arena-Ranking: Baidu Ernie-5.0-0110 belegt Platz 8 mit 1460 Punkten in Textbenchmarks der Top 10.
Das LMArena-Ranking ermittelt sich aus zahlreichen anonymen Paarvergleichen, bei denen Nutzer die bessere Modellantwort wählen.

Das Modell nutzt eine Mixture-of-Experts-Architektur mit rund 2,4 Billionen Parametern, wobei pro Anfrage weniger als 3 Prozent aktiv sind. Das Modell ist bislang nur unter ernie.baidu.com zugänglich, im Gegensatz zu früheren Ausgaben hat Baidu bislang keine Gewichte veröffentlicht. Ein technischer Report oder nähere Details zur Funktionsweise stehen ebenfalls noch aus. Zuletzt hatte Baidu mit Ernie-4.5-VL-28B-A3B-Thinking ein offenes Modell herausgebracht, das Bilder während des Denkprozesses bearbeiten kann, etwa heranzoomen, um Text besser zu lesen.