Anzeige
Skip to content

Poesie als Sicherheitslücke: Gedichte hebeln Sprachmodelle aus

Eine neue Studie zeigt: Das Umformulieren schädlicher Anfragen in Gedichtform funktioniert als universelle Jailbreak-Methode. Bei mehr als 25 führenden Sprachmodellen erzielten poetische Prompts Erfolgsquoten von bis zu 100 Prozent. Das unterstreicht einmal mehr, wie ungelöst das Thema LLM-Cybersecurity ist – wer rechnet schon mit Gedichten als Angriffstaktik?

Read full article about: ChatGPT verschmilzt Voice- und Text-Chat

OpenAI hat ChatGPT Voice direkt in den Text-Chat integriert. Nutzer können nun sprechen und gleichzeitig die Antworten als Text verfolgen, frühere Nachrichten durchsehen und visuelle Inhalte wie Bilder oder Karten sehen. Ein Wechsel in einen separaten Sprachmodus ist nicht mehr nötig. Die Integration der Sprachfunktion direkt in den Chat ermöglicht eine nahtlosere Nutzung, bei der Text- und Spracheingabe kombiniert werden können, ohne den vorherigen Kontext zu verlieren.

Das Update wird für alle Nutzer auf Mobilgeräten und im Web ausgerollt. Wer die ursprüngliche Erfahrung mit getrenntem Sprachmodus bevorzugt, kann diese Funktion in den Einstellungen unter "Voice Mode" wieder aktivieren.

Der Advanced Voice Mode ist seit Oktober 2024 in der EU verfügbar. Im Juni 2025 hatte OpenAI die Ausdrucksfähigkeit der KI-Stimme verbessert und eine Simultanübersetzungsfunktion eingeführt.

Neues Trainingsverfahren lässt KI-Agenten besser im Team arbeiten

Forscher stellen ein neues Framework vor, das verschiedene KI-Agenten gemeinsam trainieren kann. Die Methode soll komplexe Aufgaben durch spezialisierte Rollen und Teamwork besser lösen.

Forscher basteln an Webseiten für KI-Agenten

Forscher der TU Darmstadt haben mit VOIX ein Framework entwickelt, das Websites um zwei neue HTML‑Elemente erweitert. Dadurch können KI‑Agenten direkt erkennen, welche Aktionen möglich sind, statt mühsam Benutzeroberflächen auswerten zu müssen. Das verspricht schnellere und sicherere Interaktionen, erfordert aber die Unterstützung von Web‑Entwicklern.

Read full article about: Das "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune

Das nach eigener Aussage "beste Open-Weight-LLM eines US-Unternehmens" ist ein Deepseek-Finetune. Deep Cogito hat Cogito-v2.1-671B veröffentlicht, das auf dem Deepseek-Basismodell vom November 2024 basiert (vermutlich R1-Lite, Deepseek-V3-Base wurde erst im Dezember veröffentlicht) und intern nachtrainiert wurde. Das Modell konkurriert laut Deep Cogito mit führenden geschlossenen und offenen Modellen bei Branchenbenchmarks und übertrifft andere US-amerikanische offene Modelle wie GPT-OSS-120B.

Balkendiagramm: Durchschnittlicher Tokenverbrauch pro Modell, Cogito v2.1 4894 am niedrigsten, Gemini 2.5 pro 9178 am höchsten.
Die Grafik zeigt einen Mittelwert der generierten Tokens pro Benchmark-Instanz über alle Benchmarks hinweg.

Der Hauptvorteil liege in der Effizienz: Cogito v2.1 nutzt in den Benchmarks deutlich weniger Token als vergleichbare Modelle, was niedrigere API-Kosten zur Folge hat. Deep Cogito hat das Modell mit Prozessüberwachung für Denkprozesse trainiert, wodurch es kürzere Argumentationsketten benötigt. Das Modell zeigt Verbesserungen bei Prompt-Following, Programmierung, längeren Anfragen und Kreativität. Nutzer können das Modell kostenlos über chat.deepcogito.com testen, wo laut Entwickler keine Chats gespeichert werden. Die Modellgewichte sind auf Hugging Face verfügbar. Kleinere Ausgaben sollen folgen.

Neuer Benchmark entlarvt große Wissenslücken bei KI-Modellen – nur vier schaffen positive Bewertung

Ein neuer Benchmark von Artificial Analysis zeigt erschreckende Schwächen bei der faktischen Zuverlässigkeit von KI-Modellen auf. Von 40 getesteten Modellen erreichen nur vier einen positiven Score, Googles neues Gemini 3 Pro führt deutlich.

Read full article about: Microsoft, Nvidia und Anthropic schließen 45-Milliarden-Dollar-Deal

Microsoft, Nvidia und Anthropic haben neue strategische Partnerschaften im Wert von 45 Milliarden Dollar angekündigt. Anthropic skaliert sein Claude-KI-Modell auf Microsoft Azure und verpflichtet sich zum Kauf von Azure-Rechenkapazitäten im Wert von 30 Milliarden Dollar sowie zusätzlicher Kapazitäten von bis zu einem Gigawatt. Nvidia und Anthropic arbeiten erstmals eng bei Design und Engineering zusammen, um Anthropics Modelle für Nvidia-Architekturen zu optimieren. Die Rechenkapazitäten umfassen Nvidias Grace-Blackwell- und Vera-Rubin-Systeme. Nvidia investiert bis zu 10 Milliarden Dollar in Anthropic, Microsoft bis zu 5 Milliarden Dollar.

Microsoft-Foundry-Kunden erhalten Zugang zu Claude-Modellen wie Claude Sonnet 4.5, Claude Opus 4.1 und Claude Haiku 4.5. Claude wird damit als einziges Spitzenmodell auf allen drei großen Cloud-Diensten verfügbar sein. Microsoft setzt Claude weiterhin in seiner Copilot-Familie ein, einschließlich GitHub Copilot und Microsoft 365 Copilot.  Die CEOs Dario Amodei, Satya Nadella und Jensen Huang stellten die Partnerschaften in einem zehnminütigen Video gemeinsam vor.

Read full article about: Cloudflare übernimmt Replicate mit deren 50.000 KI-Modellen

Cloudflare übernimmt Replicate und erweitert damit seinen KI-Modellkatalog auf über 50.000 Modelle. Die Übernahme stärkt Cloudflares bereits bestehende Inferenz-Plattform Workers AI erheblich. Replicate-Nutzer können ihre APIs weiterhin verwenden, während Workers-AI-Nutzer Zugang zu deutlich mehr Modellen und Fine-Tuning-Funktionen erhalten. Die Unternehmen planen, den gesamten Replicate-Katalog in Workers AI zu integrieren und Entwicklern zu ermöglichen, eigene Modelle auf dem Netzwerk auszuführen.

Replicate ermöglicht Entwicklern den einfachen Zugang zu KI-Modellen über eine API und hat sich zu einem wichtigen Hub für die KI-Entwicklergemeinschaft entwickelt. Cloudflare bringt sein globales Netzwerk und die serverlose Inferenz-Technologie ein. "Zusammen werden wir zum Standard für die Entwicklung von KI-Apps", sagt Replicate-Mitgründer Ben Firshman. Dessen Unternehmen soll als eigenständige Marke weiterbestehen und von Cloudflares Ressourcen profitieren.

Cloudflare ist vor allem als DNS-Anbieter bekannt und hat kürzlich ein System eingeführt, das KI-Crawler standardmäßig blockiert und Website-Betreibern mehr Kontrolle über den Zugriff auf ihre Inhalte gibt.