Skip to content
Read full article about: Gemini-Modelle dominieren neue KI-Ranglisten für strategische Gesellschaftsspiele

Googles Gemini-Modelle schneiden in Gesellschaftsspielen am besten ab. Google Deepmind hat zusammen mit Kaggle die "Game Arena" um zwei neue Spiele erweitert: Werwolf und Poker. Die Plattform testet KI-Modelle in strategischen Spielen. Schach misst logisches Denken, Werwolf prüft soziale Fähigkeiten wie Kommunikation und das Erkennen von Täuschung, Poker testet den Umgang mit Risiko und unvollständigen Informationen.

Die Spiele lieferten objektive Messungen für Fähigkeiten wie Planung und Entscheidungen unter Unsicherheit. Gemini 3 Pro und Gemini 3 Flash belegen derzeit die ersten Plätze in allen Ranglisten. Die Werwolf-Benchmark dient auch der Sicherheitsforschung: Sie testet, ob Modelle Manipulation erkennen können, ohne reale Risiken einzugehen. Laut Google-Deepmind-CEO Demis Hassabis benötige die KI-Branche härtere Tests für die neuesten Modelle.

Read full article about: Französische Staatsanwaltschaft durchsucht X-Büros in Paris und lädt Elon Musk vor

Die französische Staatsanwaltschaft hat die Büros von Elon Musks Plattform X in Paris durchsucht. Die Cyberkriminalitätseinheit ermittelt wegen mehrerer Vorwürfe, darunter unrechtmäßige Datenextraktion und Beihilfe zur Verbreitung von Darstellungen von Kindesmissbrauch. Auch sexuelle Deepfakes sind Teil der Untersuchung. Musk und die frühere X-Chefin Linda Yaccarino wurden für April zu Anhörungen vorgeladen, berichtet die BBC. X hat die Ermittlungen zuvor als politisch motiviert bezeichnet.

Parallel dazu hat die britische Datenschutzbehörde ICO eine Untersuchung gegen Musks KI-Tool Grok eingeleitet. Es geht um die Frage, ob persönliche Daten ohne Zustimmung zur Erstellung sexualisierter Bilder verwendet wurden. Auch die britische Medienaufsicht Ofcom und die Europäische Kommission prüfen die Plattform weiterhin. X hat sich bisher nicht zu den Ermittlungen geäußert.

Read full article about: Firefox-Nutzer können bald alle generativen KI-Funktionen zentral blockieren

Mozilla führt mit Firefox 148 am 24. Februar neue KI-Einstellungen ein. Nutzer können damit alle generativen KI-Funktionen des Browsers an einem Ort verwalten oder komplett blockieren, schreibt Mozilla im Unternehmensblog.

Die neuen Einstellungen umfassen Übersetzungen, automatische Bildbeschreibungen in PDFs, KI-gestützte Tab-Gruppierung, Link-Vorschauen sowie einen Chatbot in der Seitenleiste. Für den Chatbot stehen Dienste wie Anthropic Claude, ChatGPT, Microsoft Copilot, Google Gemini und Le Chat Mistral zur Auswahl.

Wer keine KI-Funktionen nutzen möchte, kann mit einem Schalter alle KI-Erweiterungen blockieren. Dann erscheinen auch keine Pop-ups oder Hinweise zu bestehenden oder künftigen KI-Features. Die gewählten Einstellungen bleiben bei Updates erhalten. Wer die Funktion früher testen möchte, findet sie in Firefox Nightly.

Read full article about: OpenAI startet Codex-App für macOS zur Verwaltung mehrerer KI-Agenten

OpenAI hat die Codex-App für macOS vorgestellt. Die App ermöglicht es Entwicklern, mehrere KI-Agenten gleichzeitig zu steuern und Aufgaben parallel abzuarbeiten. Laut OpenAI ist Codex einfacher zu bedienen als ein Terminal und richtet sich damit an eine breitere Gruppe von Entwicklern.

Mit der App können Nutzer mehrere Agenten asynchron über verschiedene Projekte hinweg steuern, wiederkehrende Aufgaben mit sogenannten Automations planen und delegieren sowie über Skills Agenten mit externen Werkzeugen und Arbeitsabläufen verbinden. Zudem lässt sich die Arbeit der Agenten überprüfen und korrigieren, ohne den Kontext zu verlieren.

Die Codex-App (Download) ist für alle ChatGPT Plus-, Pro-, Business-, Enterprise- und Edu-Konten verfügbar. Für begrenzte Zeit können auch Nutzer von ChatGPT Free und Go die App testen – das untermauert, dass OpenAI hier Zielgruppen über Entwickler hinaus im Blick hat. Zudem verdoppelt OpenAI die Nutzungslimits für alle bezahlten Tarife. Die App funktioniert nahtlos mit dem CLI, der IDE-Erweiterung und der Cloud über ein einziges ChatGPT-Konto.