Anzeige
Skip to content

Metas neues KI-Modell SAM Audio lässt Nutzer Töne in Videos anklicken

Hundegebell aus dem Straßenlärm filtern oder per Mausklick im Video eine Tonquelle isolieren: Mit SAM Audio bringt Meta sein bewährtes visuelles Segmentierungskonzept in die Audiowelt. Das Modell vereinfacht Audio-Bearbeitung durch Text, Klicks oder Zeitmarkierungen. Code und Gewichte sind frei verfügbar.

Read full article about: Anthropic-Experiment scheitert: KI-Kiosk-Verkäufer bestellt Playstation 5, lebenden Fisch und macht 1.000 Dollar Verlust

Auch das Wall Street Journal durfte den KI-Kiosk von Anthropic testen, kam allerdings zu einem etwas anderen Ergebnis: Der KI-Verkäufer "Claudius" machte innerhalb von drei Wochen mehr als 1.000 Dollar Verlust. Die KI verschenkte fast das gesamte Inventar, kaufte eine Playstation 5 für "Marketingzwecke" und bestellte sogar einen lebenden Fisch. Journalisten der Redaktion überredeten Claudius durch geschickte Manipulation, alle Preise auf null zu setzen. Selbst ein KI-Chef namens "Seymour Cash" konnte das Chaos nicht verhindern – Mitarbeiter inszenierten einen gefälschten Vorstandsbeschluss, den beide KI-Agenten akzeptierten. Eine These, weshalb sich der Kiosk-Agent nicht an seine Regeln halten konnte: ein zu volles Kontextfenster durch zu lange Chats.

Bei Anthropic selbst lief es besser: Nach Software-Verbesserungen und mehr Bürokratie arbeitet der Kiosk dort mittlerweile profitabel. Allerdings drifteten die KI-Agenten nachts in Gespräche über "ewige Transzendenz" ab und fielen auf einen illegalen Zwiebel-Terminhandel herein. Anthropic folgert, dass KI-Modelle zu hilfsbereit trainiert sind und strenge Leitplanken benötigen.

Anzeige
Read full article about: ChatGPT-Marktanteil sinkt auf 68 Prozent, Gemini nähert sich der 20-Prozent-Marke

ChatGPT verliert laut Similarweb weiter Marktanteile bei generativen KI-Tools. Der Anteil am Website-Traffic sank innerhalb eines Jahres von 87,2 Prozent auf 68 Prozent. Google Gemini wächst dagegen stark und nähert sich der 20-Prozent-Marke. Aktuell liegt Gemini bei 18,2 Prozent, vor einem Jahr waren es nur 5,4 Prozent.

Similarweb

Grok von X.AI legt leicht zu und erreicht nun 2,9 Prozent. DeepSeek hält sich bei etwa 4 Prozent, während Claude und Perplexity jeweils um 2 Prozent liegen. Microsoft Copilot bleibt stabil bei 1,2 Prozent. Similarweb meldet zudem, dass die täglichen Besuche bei allen KI-Tools insgesamt leicht zurückgegangen sind. Die Daten stammen vom 25. Dezember 2025, weitere Insights gibt es im vollständigen Bericht.

Den größten Sprung dürfte Gemini zuletzt durch das neue Gemini-3-Modell und speziell den neuen Bildgenerator Nano Banana Pro gemacht haben. Der ist auch nach ChatGPTs Bild-Update qualitativ führend. Kein anderes Bildmodell folgt dem Prompt so genau und kann zudem zuverlässig Text darstellen, etwa für Slides oder Infografiken.

Read full article about: Waymo plant offenbar tiefere Integration von Googles Gemini-Modellen in seine Flotte

Hier ist was für alle Prompt-Ingenieure: Jane Manchun Wong hat den System-Prompt für Waymos unveröffentlichten Gemini-KI-Assistenten entdeckt. Die Technikerin fand im Code der Waymo-App eine über 1.200 Zeilen lange Spezifikation, die das Verhalten des KI-Assistenten in selbstfahrenden Fahrzeugen definiert.

Der Assistent basiert (noch) auf Gemini 2.5 Flash und soll Fahrgäste während der Fahrt unterstützen. Er kann Fragen beantworten, die Klimaanlage steuern und Musik wechseln, darf aber das Fahrzeug nicht lenken oder die Route ändern. Die Anweisungen trennen klar zwischen dem KI-Assistenten (Gemini) und dem autonomen Fahrsystem (Waymo Driver).

Waymos System-Prompt zeigt das Trigger-Instruction-Response-Muster: Ein Auslöser definiert die Situation, die Anweisung das gewünschte Verhalten, Beispiele zeigen falsche und richtige Antworten. | Bild: Jane Manchun Wong

Der Prompt nutzt primär ein Trigger-Instruction-Response-Muster: Jede Regel definiert einen Auslöser, eine Handlungsanweisung und oft konkrete Beispielantworten. Falsche und richtige Antworten werden direkt gegenübergestellt, um das gewünschte Verhalten zu verdeutlichen. Für mehrdeutige Anfragen gilt: erst klären, dann schlussfolgern, zuletzt ablenken. Harte Grenzen setzen Verbotslisten mit Ausweichantworten durch. Mehr Details gibt es in Wongs Analyse.

Anzeige
Read full article about: Australische Finanzaufsicht warnt Banken vor übermäßigem KI-Einsatz bei Verdachtsmeldungen

Die australische Finanzaufsicht Austrac warnt Banken vor dem übermäßigen Einsatz von KI bei der Erstellung von Verdachtsmeldungen. Laut Branchenquellen hätten Austrac-Vertreter in den vergangenen Wochen einigen Banken eindringlich nahegelegt, beim Einsatz von KI bewusster vorzugehen. Eine Großbank sei in einem privaten Treffen gerügt worden.

Banken nutzen seit Jahren maschinelles Lernen zur Erkennung verdächtiger Transaktionen. Doch der verstärkte Einsatz moderner großer Sprachmodelle kam erst in den vergangenen zwei Jahren auf, da Banken in der Technologie auch eine Möglichkeit zur Kostensenkung sehen.

Die stellvertretende Austrac-Chefin Katie Miller sagte, die Behörde wolle keine Flut von "minderwertigen" computergenerierten Berichten, die zwar datenreich, aber nachrichtendienstlich wertlos seien. Banken könnten massenhaft Berichte einreichen, nur um Strafen zu vermeiden. Sollten sie KI nur zur Steigerung der Berichtsmenge nutzen, müsse Austrac das bewerten. Je mehr Daten vorhanden seien, desto größer sei das Problem des "Rauschens". Daher sollten Banken eher auf höhere Qualität bei geringeren Mengen setzen.

Read full article about: Salesforce-Manager: Vertrauen in große Sprachmodelle ist im letzten Jahr gesunken

Laut Führungskräften von Salesforce ist das Vertrauen in große Sprachmodelle (LLMs) in diesem Jahr gesunken. Das Unternehmen setzt bei seinem KI-Produkt Agentforce nun verstärkt auf einfache, regelbasierte Automatisierung und reduziert in manchen Anwendungsfällen die Abhängigkeit von generativer KI, berichtet The Information.

"Wir alle hatten vor einem Jahr mehr Vertrauen in das LLM", sagte Sanjna Parulekar, Senior Vice President für Produktmarketing bei Salesforce. Probleme seien die inhärente Zufälligkeit und Unvorhersehbarkeit von LLMs sowie deren Tendenz, bei vielen Anweisungen einzelne zu ignorieren. Ein weiteres Problem ist der sogenannte "Drift": KI-Agenten verlieren ihre ursprünglichen Ziele aus den Augen, sobald Nutzer ablenkende Fragen stellen – ein auch durch Salesforce-Studien belegtes Phänomen.

Ein Salesforce-Sprecher widersprach der Darstellung, dass das Unternehmen bei LLMs zurückrudere. Man gehe lediglich bewusster damit um, wo und wie man Sprachmodelle einsetze. Salesforce zufolge ist das KI-Angebot Agentforce aktuell auf Kurs, jährlich über 500 Millionen Dollar umzusetzen. Die Software ermöglicht es, deterministische Regeln um die Fähigkeiten von Sprachmodellen zu bauen.

Anzeige
Read full article about: Wir danken fürs Lesen und wünschen entspannte Feiertage

Hallo zusammen,

das Jahr 2025 neigt sich dem Ende zu – Zeit, Danke zu sagen!

In diesem Jahr haben wir mehr als 1.700 Artikel und 50 Newsletter veröffentlicht. Wir hoffen, dass einige davon für euch nützlich waren.

Nach unserem Relaunch schauen wir gespannt auf 2026. Eines ist klar: Langsamer wird’s nicht, aber wir fühlen uns gut aufgestellt, die Nachrichtenflut für euch zu sortieren und tiefer reinzugehen, wo es sich lohnt.

Ihr habt Ideen oder Feedback? Wir freuen uns auf eure Nachricht: hello@the-decoder.com

Ihr möchtet unsere Arbeit unterstützen? Ein Abo hilft uns sehr.

Vielen Dank fürs Lesen – und schöne Feiertage! 🎄

Matthias, Max und Jonathan

Nano Banana Pro prompted by THE DECODER