Anzeige
Short

Es sieht so aus, als würde die Menschheit ihr finales Examen selbst nicht bestehen. Laut FutureHouse enthalten rund 29 Prozent der Biologie- und Chemiefragen im KI-Benchmark Humanity’s Last Exam (HLE) Antworten, die laut Fachliteratur falsch oder irreführend sind. Die Fehlerquote wurde durch eine Kombination aus menschlicher und KI-gestützter Analyse ermittelt.

HLE wurde als besonders schwieriger Test konzipiert, um moderne Sprachmodelle an ihre Grenzen zu bringen, enthält aber laut der Analyse viele missverständliche oder ungenaue Fragen. Die Überprüfung durch Fachleute war auf wenige Minuten begrenzt, eine vollständige Richtigkeitsprüfung war nicht gefordert. FutureHouse veröffentlichte nun ein geprüftes Teilset namens "HLE Bio/Chem Gold" auf HuggingFace.

Short

Die US-Behörde FDA, die über Medikamentenzulassungen entscheidet, setzt auf das generative KI-System Elsa – obwohl das laut Insidern regelmäßig Studien halluziniert.

„Alles, wofür man keine Zeit hat, es zu überprüfen, ist unzuverlässig. Es halluziniert voller Überzeugung“, sagt ein aktueller FDA-Mitarbeiter über das KI-System „Elsa“ (Efficient Language System for Analysis), das eigentlich die Zulassung neuer Medikamente beschleunigen soll. Mehrere Beschäftigte berichten gegenüber CNN, dass Elsa regelmäßig nicht existierende Studien erfindet oder Forschungsdaten falsch darstellt – ein bekanntes Problem großer Sprachmodelle. Der FDA-Chef für KI, Jeremy Walsh, räumt ein: „Elsa unterscheidet sich nicht von vielen anderen großen Sprachmodellen und generativer KI. Sie kann möglicherweise halluzinieren.“

Trotz dieser bekannten Schwächen wird Elsa bereits zur Bewertung klinischer Protokolle und zur Risikoeinschätzung bei Inspektionen eingesetzt – und das in einem regulatorischen Vakuum, da es in den USA derzeit keine verbindlichen Regeln für den Einsatz von KI im Gesundheitswesen gibt.

Anzeige
Anzeige
Short

Google führt neue KI-Funktionen in der Google-Photos-App ein. Mit „Photo to video“ lassen sich aus einzelnen Fotos kurze, sechssekündige Videoclips erstellen, etwa mit leichten Bewegungen. Die Funktion basiert auf Googles Veo 2 und startet ab sofort in den USA auf Android und iOS. Die Funktion „Remix“ verwandelt Fotos in Anime, Comics oder 3D-Animationen und wird in den nächsten Wochen ebenfalls in den USA verfügbar sein. Beide Tools kennzeichnen generierte Inhalte mit einem sichtbaren und einem unsichtbaren Wasserzeichen zur besseren Nachvollziehbarkeit. Zusätzlich führt Google einen neuen „Create“-Tab in der App ein, der alle kreativen Funktionen bündelt. Dieser wird im August in den USA ausgerollt.

Video: Google

Anzeige
Anzeige
Short

Googles KI-Offensive erreicht den Massenmarkt: 2 Milliarden für AI Overviews, 450 Millionen für Gemini, 70 Millionen erzeugte Videos mit Veo 3.

„AI Overviews haben jetzt zwei Milliarden monatliche Nutzer:innen“, sagte CEO Sundar Pichai bei der Q2-Investorenkonferenz. Die Funktion, die KI-generierte Zusammenfassungen direkt in der Suche anzeigt, ist in über 200 Ländern verfügbar – und steigert laut Google die Suchanfragen um mehr als zehn Prozent bei den Suchtypen, bei denen sie angezeigt wird. Warum, verriet er nicht.

Die Gemini-App kommt zudem auf 450 Millionen monatlich aktive Nutzer:innen, mit einem Anstieg der täglichen Anfragen um mehr als 50 Prozent seit dem ersten Quartal. Der neue „AI Mode“, ein Chat-Interface innerhalb der Google-Suche, zählt über 100 Millionen monatlich aktive Nutzer:innen in den USA und Indien. Mit dem viral gegangenen Text-zu-Video-Modell Veo 3 wurden seit Mai laut Pichai über 70 Millionen Videos generiert.

Short

Update: Die Registrierung ist jetzt verfügbar. Plätze werden per Lotterieverfahren vergeben.

OpenAI kündigt seinen nächsten DevDay für den 6. Oktober 2025 in San Francisco an. Die Veranstaltung soll mit mehr als 1.500 Entwicklern die bisher größte ihrer Art werden. Geplant sind eine live übertragene Eröffnungs-Keynote, praktische Workshops mit den neuesten Modellen und Tools sowie mehr Bühnen und Demos als im Vorjahr. Weitere Details zur Veranstaltung sind bisher nicht bekannt. Eine Anmeldung für die Bekanntgabe der Registrierung ist hier möglich.

Anzeige
Anzeige
Google News