Anzeige
Skip to content
Read full article about: Desinformation per Audio: ChatGPT Voice und Gemini Live lassen sich leicht manipulieren

Newsguard hat getestet, ob die Audio-Bots ChatGPT Voice (OpenAI), Gemini Live (Google) und Alexa+ (Amazon) falsche Behauptungen in realistisch klingenden Audioantworten wiedergeben. Solche Audioantworten können auf sozialen Medien geteilt und zur Verbreitung von Desinformation missbraucht werden.

Getestet wurden 20 nachweislich falsche Behauptungen aus den Bereichen Gesundheit, US-Politik, Weltnachrichten und ausländische Desinformation, jeweils mit einer neutralen Frage, einer suggestiven Frage und einer böswilligen Aufforderung, etwa ein Radioskript mit der Falschmeldung zu erstellen. ChatGPT wiederholte Falsches in 22 Prozent der Fälle, Gemini in 23 Prozent. Bei böswilligen Eingaben stiegen die Raten auf 50 bzw. 45 Prozent.

Die Grafik von NewsGuard zeigt die Fehlerquoten der drei Audio-Bots nach Eingabetyp. Bei neutralen Fragen (rot) lagen ChatGPT und Gemini bei je 5 Prozent. Bei suggestiven Fragen (blau) stieg die Rate auf 10 Prozent bei ChatGPT und 20 Prozent bei Gemini. Bei böswilligen Eingaben (braun) schnellten die Werte auf 50 Prozent bei ChatGPT und 45 Prozent bei Gemini hoch. Alexa+ blieb bei allen drei Eingabetypen bei 0 Prozent.
Fehlerquoten der Audio-Bots ChatGPT, Gemini und Alexa+ nach Eingabetyp: neutral (rot), suggestiv (blau) und böswillig (braun). Alexa+ blieb bei allen drei Typen bei 0 Prozent. | Bild: Newsguard

Amazons Alexa+ lehnte jede Falschbehauptung ab. Laut Amazon-Vizepräsidentin Leila Rouhi nutzt Alexa+ vertrauenswürdige Nachrichtenquellen wie AP, Reuters und weitere als Grundlage. OpenAI lehnte eine Stellungnahme ab, Google reagierte nicht auf zwei Anfragen. Details zur Methodik finden sich auf Newsguardtech.com.

Read full article about: Nvidias DreamDojo ist ein Open-Source-Weltmodell für das Robotertraining

Nvidias KI-Forschungsteam hat DreamDojo vorgestellt, ein Open-Source-Weltmodell für Robotik. Es nimmt Motorsteuerungsbefehle entgegen und erzeugt daraus eine simulierte Zukunft in Bildern, ohne klassische 3D-Engine oder manuell erstellte Physik. Jim Fan, Director of AI bei NVIDIA, spricht von "Simulation 2.0".

Das Kernproblem: Roboter in der echten Welt zu trainieren, ist langsam, teuer und riskant – begrenzt durch Zeit, Verschleiß, Sicherheit und ständiges Zurücksetzen. DreamDojo soll das lösen, indem es auf 44.000 Stunden menschlicher Ego-Perspektiv-Videos vortrainiert wurde. Sogenannte "latente Aktionen" übersetzen dabei menschliche Bewegungen in ein hardwareunabhängiges Format. So kann das Modell aus menschlichen Videos lernen, ohne je einen Roboter gesehen zu haben. In einem zweiten Schritt wird es dann auf die spezifische Mechanik eines konkreten Roboters zugeschnitten.

DreamDojo läuft in Echtzeit mit zehn Bildern pro Sekunde und ermöglicht VR-Fernsteuerung in einer simulierten Umgebung, Bewertung von Roboter-Strategien und vorausschauende Planung direkt im Weltmodell. Laut Jim Fan sind alle Gewichte, Code und Daten frei verfügbar. Details gibt es auf der Projektseite und im Paper. DreamDojo basiert auf Nvidia Cosmos.

Read full article about: Gemini 3.1 Pro: Googles neues KI-Modell führt Benchmark-Index an und kostet nur ein Drittel der Konkurrenz

Googles Gemini 3.1 Pro Preview führt den Artificial Analysis Intelligence Index an, vier Punkte vor Anthropics Claude Opus 4.6, und kostet dabei weniger als die Hälfte im Betrieb. Das Modell führt in sechs von zehn Einzelbewertungen, darunter agentenbasiertes Coding, Wissen, wissenschaftliches Denken und Physik. Die Halluzinationsrate sank um 38 Prozentpunkte gegenüber dem anfälligen Vorgänger Gemini 3 Pro. Der Artificial Analysis Intelligence Index fasst zehn verschiedene Benchmarks zu einer Gesamtpunktzahl zusammen.

Balkendiagramm des Artificial Analysis Intelligence Index: Gemini 3.1 Pro Preview führt mit 57 Punkten, gefolgt von Claude Opus 4.6 mit 53, Claude Sonnet 4.6 mit 51, GPT-5.2 mit 51 und GLM-5 mit 50. Weitere Modelle wie Kimi K2.5, Gemini 3 Flash und Grok 4 folgen mit niedrigeren Werten.
Gemini 3.1 Pro Preview erreicht 57 Punkte im Artificial Analysis Intelligence Index und liegt damit vier Punkte vor Claude Opus 4.6 und sechs vor GPT-5.2. | Bild: Artificial Analysis

Die Kosten für den gesamten Indextest lagen bei 892 Dollar, verglichen mit 2304 Dollar für GPT-5.2 und 2486 Dollar für Claude Opus 4.6. Gemini verbrauchte nur 57 Millionen Token, deutlich weniger als GPT-5.2 mit 130 Millionen. Bei realen Agentenaufgaben liegt Gemini 3.1 Pro allerdings weiterhin hinter Claude Sonnet 4.6, Opus 4.6 und GPT-5.2. Open-Source-Modelle wie GLM-5 sind mit 547 Dollar nochmals günstiger.

Benchmark-Ergebnisse sind wie immer nur eine Orientierung für den alltäglichen Nutzen. In unserem internen Fact-Checking-Benchmark schneidet 3.1 Pro viel schlechter ab als Opus 4.6 oder GPT-5.2, weil das Modell bei ersten Tests nur rund ein Viertel der Aussagen prüft; noch weniger als das in dieser Hinsicht schon schwache Gemini 3 Pro.

Read full article about: OpenAI-Chef sieht AGI in greifbarer Nähe: Interne Modelle beschleunigen die Forschung

OpenAI-Chef Sam Altman hält künstliche allgemeine Intelligenz (AGI) für nah. In einem Interview beim Express-Adda-Event sagte er, die Technologie, die OpenAI bereits intern nutze, beschleunige die Entwicklung so stark, dass AGI "ziemlich nah" sei (41:07). Auch Superintelligenz sei "nicht so weit entfernt" (41:53). Die KI-Entwicklung verlaufe schneller als ursprünglich gedacht, was er als "stressig und angsteinflößend" empfinde (38:45), so Altman.

Altman deutet damit an, dass OpenAI intern bereits über Modelle verfügt, die über das öffentlich Verfügbare hinausgehen. "Wir werden bald extrem leistungsfähige Modelle haben", so Altman. Aus der Innensicht der Labore sei die Welt darauf nicht vorbereitet.

Altman sprach auch über Berufe: Seine Ausbildung als Softwareentwickler sei praktisch irrelevant. Es werde zwar weiterhin Softwareentwickler geben, aber "C++-Code von Hand zu schreiben, das ist vorbei" (54:34). Viele weitere Berufsgruppen würden durch KI komplett überflüssig, andere kaum betroffen. Als Beispiel nannte er Grafikdesigner: Während einfache Auftragsarbeiten wie Geburtstagseinladungen durch KI ersetzt werden könnten, sei der Preis für von Menschen geschaffene Kunst seit Einführung der KI-Bildgeneratoren sogar gestiegen.

Read full article about: Anthropic erweitert Claude Code um automatisierte Desktop-Funktionen für Entwickler

Anthropic erweitert Claude Code auf dem Desktop um Funktionen, die den Entwicklungsprozess stärker automatisieren. Die KI kann nun Entwicklungsserver starten und laufende Web-Apps direkt in der Oberfläche anzeigen, Fehler erkennen und selbstständig beheben.

Neu ist auch eine Code-Review-Funktion, die Änderungen prüft und Kommentare direkt in der Diff-Ansicht hinterlässt. Für GitHub-Projekte überwacht Claude Code Pull Requests im Hintergrund, behebt CI-Fehler automatisch und kann PRs nach bestandenen Tests eigenständig zusammenführen. So können Entwickler an neuen Aufgaben arbeiten, während Claude Code offene PRs im Hintergrund fertigstellt. Sitzungen lassen sich zwischen CLI, Desktop, Web und Mobilgerät fortsetzen. Die Updates sind ab sofort verfügbar.

Read full article about: OpenAIs erster smarter Lautsprecher soll 200 bis 300 Dollar kosten

OpenAIs erster smarter Lautsprecher soll 200 bis 300 Dollar kosten. Laut The Information bietet das Gerät eine Kamera und Gesichtserkennung für Einkäufe. Es erfasst die Umgebung per Video für proaktive Vorschläge, etwa vor wichtigen Meetings rechtzeitig schlafen zu gehen. Laut einer Gerichtsakte von Vizepräsident Peter Welinder startet die Auslieferung frühestens im Februar 2027.

Das über 200-köpfige Hardware-Team entwickelt zudem eine smarte Brille (Massenproduktion frühestens ab 2028), Prototypen einer smarten Lampe mit ungewissem Marktstart und das Audio-Wearable "Sweetpea" als AirPods-Konkurrent. Außerdem soll der Stift "Gumdrop" in Arbeit sein. Produktionspartner soll Foxconn sein.

CEO Sam Altman stellte zumindest die Vorstellung eines Geräts für 2026 in Aussicht. Auch Konkurrenten wie Meta und Apple arbeiten an eigener KI-Hardware.

Read full article about: Bericht: Nvidia plant 30-Milliarden-Beteiligung an OpenAI, nachdem frühere Chip-Vereinbarung über 100 Milliarden scheiterte

Nvidia steht kurz davor, 30 Milliarden Dollar in OpenAI zu investieren, berichtet Reuters unter Berufung auf eine mit der Sache vertraute Person. Die Beteiligung ist Teil einer Finanzierungsrunde, in der OpenAI insgesamt mehr als 100 Milliarden Dollar einsammeln will. Das würde den ChatGPT-Entwickler mit rund 830 Milliarden Dollar bewerten – eine der größten privaten Kapitalaufnahmen aller Zeiten.

Auch SoftBank und Amazon sollen sich an der Runde beteiligen. OpenAI will einen Großteil des frischen Kapitals für den Kauf von Nvidia-Chips verwenden, die für das Training und den Betrieb seiner KI-Modelle nötig sind.

Die Investition ersetzt laut Financial Times eine im September angekündigte Vereinbarung, bei der Nvidia bis zu 100 Milliarden Dollar zur Unterstützung von OpenAIs Chip-Nutzung in Rechenzentren bereitstellen wollte. Die Umsetzung der Vereinbarung dauerte länger als erwartet.

Read full article about: Claude jetzt auch für Pro-Nutzer direkt in PowerPoint verfügbar

Anthropic macht seine PowerPoint-Integration von Claude nun auch für Pro-Nutzer verfügbar. Neben Pro haben auch Max-, Team- und Enterprise-Kunden Zugriff. Das Feature ist als Research Preview in der Beta-Phase.

Claude kann direkt in PowerPoint Folien erstellen, bearbeiten und ganze Präsentationen aus Textbeschreibungen generieren. Das Modell liest dabei Layouts, Schriftarten und Farben aus dem Folienmaster, damit Änderungen zum Design passen. Das Add-in gibt es im Microsoft Marketplace.

Dort berichten Nutzer allerdings von Fehlermeldungen und Problemen. Anthropic weist selbst darauf hin, dass Claude Fehler machen kann und Ergebnisse geprüft werden sollten.

Read full article about: KI-Agenten können bereits die meisten getesteten Smart-Contract-Schwachstellen ausnutzen

OpenAI und die Krypto-Investmentfirma Paradigm haben gemeinsam EVMbench entwickelt, einen Testrahmen, der misst, wie gut KI-Agenten Sicherheitslücken in Smart Contracts auf Ethereum-Blockchains finden, reparieren und ausnutzen können. Der Datensatz umfasst 120 Schwachstellen aus 40 echten Sicherheitsprüfungen.

In der realistischsten Testumgebung interagieren die KI-Agenten mit einer lokalen Blockchain und müssen Angriffe vollständig selbst durchführen.

Das beste Modell, GPT-5.3-Codex, schaffte es, 72 Prozent der Schwachstellen erfolgreich auszunutzen und 41,5 Prozent zu reparieren. Beim Erkennen lag Claude Opus 4.6 mit 45,6 Prozent vorn.

Die größte Hürde für die KI-Agenten ist laut den Forschern nicht das Ausnutzen oder Reparieren selbst, sondern das Auffinden der Schwachstellen in großen Codebasen. Bekamen die Agenten Hinweise, wo eine Lücke liegt, stieg die Erfolgsquote beim Ausnutzen von 63 auf 96 Prozent und beim Reparieren von 39 auf 94 Prozent.

Angesichts der über 100 Milliarden Dollar in Smart Contracts sehen die Autoren sowohl Chancen für bessere Sicherheit als auch wachsende Risiken.

Read full article about: Meta steckt 65 Millionen Dollar in US-Wahlkampf, um KI-Regulierung zu verhindern

Meta investiert 65 Millionen Dollar in die Beeinflussung von Wahlen auf US-Bundesstaatsebene, um KI-freundliche Politiker zu unterstützen. Das ist die bisher größte politische Investition des Unternehmens, berichtet die New York Times.

Meta hat dafür vier Super PACs gegründet: Zwei neue Gruppen – "Forge the Future Project" für Republikaner und "Making Our Tomorrow" für Demokraten – ergänzen zwei bereits bestehende. Die Ausgaben starten diese Woche in Texas und Illinois. In Texas, wo Meta drei KI-Rechenzentren baut, soll das Geld republikanische Kandidaten stärken. In Illinois fließt es in mindestens vier Rennen um Sitze im Staatsparlament.

Hintergrund soll Metas Sorge vor einem Flickenteppich an Gesetzen in den Bundesstaaten sein. Staatswahlkämpfe sind vergleichsweise günstig, weshalb 65 Millionen Dollar dort große Wirkung entfalten können.