Anzeige
Short

Das KI-Startup Cognition verhandelt laut Forbes mit Investoren über eine Finanzierung von über 300 Millionen US-Dollar bei einer Bewertung von 10 Milliarden US-Dollar. Beteiligt sind demnach unter anderem Founders Fund und Khosla Ventures. Noch im März wurde Cognition mit 4 Milliarden US-Dollar bewertet, angeführt von 8VC, der Firma von Palantir-Mitgründer Joe Lonsdale. Die Gespräche sind laut einer Quelle noch nicht final abgeschlossen. Cognition ist bekannt für seinen Programmier-Agenten Devin und hatte zuletzt den Rest des KI-Coding-Startups Windsurf übernommen, nachdem dessen Gründer überraschend doch zu Google wechselten und OpenAIs geplante Übernahme gescheitert war.

Short

Googles neue KI-Suchfunktion „Web Guide“ stellt bei einer Anfrage automatisch mehrere verwandte Suchanfragen.

Web Guide nutzt eine angepasste Version von Gemini, um sowohl Suchanfragen als auch Webinhalte besser zu verstehen. Das System "verwendet eine Query Fan-out-Technik und führt gleichzeitig mehrere verwandte Suchen durch, um die relevantesten Ergebnisse zu identifizieren", erklärt Google in der Ankündigung.

Diese Herangehensweise ermöglicht es, Webseiten zu entdecken, die Nutzer "möglicherweise vorher nicht gefunden hätten". Das Experiment gruppiert Web-Links thematisch – etwa nach spezifischen Aspekten einer Suchanfrage. Google testet das System zunächst im Search Labs-Programm und plant, KI-organisierte Ergebnisse schrittweise auch in anderen Bereichen der Suche einzuführen.

Video: Google

Anzeige
Short

Es sieht so aus, als würde die Menschheit ihr finales Examen selbst nicht bestehen. Laut FutureHouse enthalten rund 29 Prozent der Biologie- und Chemiefragen im KI-Benchmark Humanity’s Last Exam (HLE) Antworten, die laut Fachliteratur falsch oder irreführend sind. Die Fehlerquote wurde durch eine Kombination aus menschlicher und KI-gestützter Analyse ermittelt.

HLE wurde als besonders schwieriger Test konzipiert, um moderne Sprachmodelle an ihre Grenzen zu bringen, enthält aber laut der Analyse viele missverständliche oder ungenaue Fragen. Die Überprüfung durch Fachleute war auf wenige Minuten begrenzt, eine vollständige Richtigkeitsprüfung war nicht gefordert. FutureHouse veröffentlichte nun ein geprüftes Teilset namens "HLE Bio/Chem Gold" auf HuggingFace.

Anzeige
Short

Die US-Behörde FDA, die über Medikamentenzulassungen entscheidet, setzt auf das generative KI-System Elsa – obwohl das laut Insidern regelmäßig Studien halluziniert.

„Alles, wofür man keine Zeit hat, es zu überprüfen, ist unzuverlässig. Es halluziniert voller Überzeugung“, sagt ein aktueller FDA-Mitarbeiter über das KI-System „Elsa“ (Efficient Language System for Analysis), das eigentlich die Zulassung neuer Medikamente beschleunigen soll. Mehrere Beschäftigte berichten gegenüber CNN, dass Elsa regelmäßig nicht existierende Studien erfindet oder Forschungsdaten falsch darstellt – ein bekanntes Problem großer Sprachmodelle. Der FDA-Chef für KI, Jeremy Walsh, räumt ein: „Elsa unterscheidet sich nicht von vielen anderen großen Sprachmodellen und generativer KI. Sie kann möglicherweise halluzinieren.“

Trotz dieser bekannten Schwächen wird Elsa bereits zur Bewertung klinischer Protokolle und zur Risikoeinschätzung bei Inspektionen eingesetzt – und das in einem regulatorischen Vakuum, da es in den USA derzeit keine verbindlichen Regeln für den Einsatz von KI im Gesundheitswesen gibt.

Google News