Anzeige
Skip to content

Jonathan Kemper

Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.

Klings Video O1 kann Szenen, Subjekte und Kameraeinstellungen ändern – alles gleichzeitig

Das chinesische KI-Unternehmen Kuaishou hat das Modell „Video O1“ vorgestellt. Laut dem Unternehmen hinter Kling AI handelt es sich um das „weltweit erste vereinheitlichte multimodale Videomodell“, das verschiedene Aufgaben der Videogenerierung und -bearbeitung in einem einzigen System zusammenführt.

Deepseek V3.2 soll GPT-5 und Gemini 3 Pro Konkurrenz machen

Deepseek‑V3.2 tritt nicht nur als Open‑Weight‑Modell an, sondern punktet besonders in agentischen Szenarien und beim Umgang mit MCP‑Servern – und setzt damit Branchenriesen wie OpenAI weiter unter Druck.

KI lokal nutzen, aber einfach: Pinokio 5.0 bringt offene Modelle auf den eigenen PC

Pinokio 5.0 will die technischen Hürden für die lokale Nutzung von KI-Modellen senken. Die Software automatisiert notwendige Installationen im Hintergrund und macht Open-Source-Anwendungen über eine grafische Oberfläche zugänglich. Mit neuen Funktionen wie KI-generierten Start-Skripten und einer automatischen Vernetzung im LAN fungiert der eigene Rechner dabei als persönliche Cloud-Alternative.

Microsoft veröffentlicht winziges Modell für lokale KI-Computersteuerung

KI soll Wissensarbeit automatisieren – auch, indem sie unsere Computer steuert. Bisher gelingt das nur mäßig: Die Systeme arbeiten ineffektiv und bringen erhebliche Sicherheitsrisiken mit sich. Fara-7B von Microsoft löst diese Probleme zwar nicht, steigert aber die Effizienz. Das kompakte Modell läuft lokal auf dem Rechner.

Qwen3-VL analysiert zweistündige Videos und findet fast jedes Detail

Wenige Monate nach der Veröffentlichung legt Alibaba nun den detaillierten technischen Bericht zu Qwen3-VL vor. Das offene, multimodale KI-Modell zeigt in Tests überlegene Leistungen bei mathematischen Aufgaben mit Bildern und kann stundenlange Videos analysieren.

Poesie als Sicherheitslücke: Gedichte hebeln Sprachmodelle aus

Eine neue Studie zeigt: Das Umformulieren schädlicher Anfragen in Gedichtform funktioniert als universelle Jailbreak-Methode. Bei mehr als 25 führenden Sprachmodellen erzielten poetische Prompts Erfolgsquoten von bis zu 100 Prozent. Das unterstreicht einmal mehr, wie ungelöst das Thema LLM-Cybersecurity ist – wer rechnet schon mit Gedichten als Angriffstaktik?

Read full article about: ChatGPT verschmilzt Voice- und Text-Chat

OpenAI hat ChatGPT Voice direkt in den Text-Chat integriert. Nutzer können nun sprechen und gleichzeitig die Antworten als Text verfolgen, frühere Nachrichten durchsehen und visuelle Inhalte wie Bilder oder Karten sehen. Ein Wechsel in einen separaten Sprachmodus ist nicht mehr nötig. Die Integration der Sprachfunktion direkt in den Chat ermöglicht eine nahtlosere Nutzung, bei der Text- und Spracheingabe kombiniert werden können, ohne den vorherigen Kontext zu verlieren.

Das Update wird für alle Nutzer auf Mobilgeräten und im Web ausgerollt. Wer die ursprüngliche Erfahrung mit getrenntem Sprachmodus bevorzugt, kann diese Funktion in den Einstellungen unter "Voice Mode" wieder aktivieren.

Der Advanced Voice Mode ist seit Oktober 2024 in der EU verfügbar. Im Juni 2025 hatte OpenAI die Ausdrucksfähigkeit der KI-Stimme verbessert und eine Simultanübersetzungsfunktion eingeführt.