Praxis Archive

25. Dezember 2025

Laut Führungskräften von Salesforce ist das Vertrauen in große Sprachmodelle (LLMs) in diesem Jahr gesunken. Das Unternehmen setzt bei seinem KI-Produkt Agentforce nun verstärkt auf einfache, regelbasierte Automatisierung und reduziert in manchen Anwendungsfällen die Abhängigkeit von generativer KI, berichtet The Information.

"Wir alle hatten vor einem Jahr mehr Vertrauen in das LLM", sagte Sanjna Parulekar, Senior Vice President für Produktmarketing bei Salesforce. Probleme seien die inhärente Zufälligkeit und Unvorhersehbarkeit von LLMs sowie deren Tendenz, bei vielen Anweisungen einzelne zu ignorieren. Ein weiteres Problem ist der sogenannte "Drift": KI-Agenten verlieren ihre ursprünglichen Ziele aus den Augen, sobald Nutzer ablenkende Fragen stellen – ein auch durch Salesforce-Studien belegtes Phänomen.

Ein Salesforce-Sprecher widersprach der Darstellung, dass das Unternehmen bei LLMs zurückrudere. Man gehe lediglich bewusster damit um, wo und wie man Sprachmodelle einsetze. Salesforce zufolge ist das KI-Angebot Agentforce aktuell auf Kurs, jährlich über 500 Millionen Dollar umzusetzen. Die Software ermöglicht es, deterministische Regeln um die Fähigkeiten von Sprachmodellen zu bauen.

Kommentieren Quelle: The Information

Matthias Bastian

25. Dezember 2025

Praxis

20-Milliarden-Deal: Nvidia rüstet gegen Googles TPUs auf

Nvidia kauft sich für 20 Milliarden Dollar Weihnachtsgeschenke: ein angeschlagenes Chip-Startup und dessen Gründer. Steuervorteil und Rüstung gegen Googles TPUs in einem Aufwasch.

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

24. Dezember 2025

Short News

OpenAIs Werbepläne in ChatGPT werden konkreter. Mitarbeiter diskutieren laut The Information verschiedene Werbeformate für den Chatbot. Eine Option: KI-Modelle könnten gesponserte Inhalte bevorzugt in Antworten einbauen. Bei einer Frage nach Mascara-Empfehlungen würde dann etwa eine Sephora-Werbung erscheinen. Interne Entwürfe zeigen zudem Werbung in einer Seitenleiste neben dem Antwortfenster.

Eine weitere Variante sieht vor, Anzeigen erst im zweiten Schritt zu zeigen, wenn Nutzer mehr Informationen wünschen. Fragt jemand nach einer Barcelona-Reise und klickt auf einen Vorschlag wie die Sagrada Família, könnten gesponserte Links zu Tourangeboten erscheinen. Ein Sprecher bestätigte, dass das Unternehmen prüft, wie Werbung im Produkt aussehen könnte, ohne das Vertrauen der Nutzer zu enttäuschen.

OpenAI-CEO Sam Altman bezeichnete in der Vergangenheit durch Werbung beeinflusste KI-Antworten als dystopische Zukunft, insbesondere wenn diese Empfehlungen sich aus bisherigen, privaten Gesprächen mit dem Chatbot ergeben. Genau daran soll OpenAI angeblich arbeiten: Werbung auf Basis der ChatGPT-Memory-Funktion, die persönliche Gesprächsverläufe für zielgerichtete Anzeigen nutzen könnte.

Kommentieren Quelle: The Information

Matthias Bastian

24. Dezember 2025

Short News

Qwen verbessert sein kürzlich veröffentlichtes Bildbearbeitungsmodell. Das chinesische KI-Unternehmen hat Qwen-Image-Edit-2511 auf Hugging Face veröffentlicht, eine erweiterte Version des Vorgängers Qwen-Image-Edit-2509. Die wichtigste Neuerung ist eine stark verbesserte Konsistenz bei der Bearbeitung von Personen. Das Modell kann laut Qwen nun kreative Änderungen an Porträts vornehmen und dabei die Identität der abgebildeten Person besser bewahren. Auch Gruppenfotos mit mehreren Personen lassen sich jetzt besser bearbeiten.

Weitere Verbesserungen betreffen die Lichtsteuerung, neue Blickwinkel, industrielles Produktdesign und geometrische Berechnungen. Qwen hat zudem beliebte LoRAs (kleine Zusatzmodelle) aus der Community direkt ins Basismodell eingebaut. Das Modell steht unter der Apache-2.0-Lizenz zur Verfügung. Eine Demo ist auf Hugging Face abrufbar, das Modell kann auch über Qwen Chat kostenlos getestet werden.

Kommentieren Quelle: Hugging Face

Matthias Bastian

24. Dezember 2025

Praxis

Zelda-Rätsel zeigt: KI-Modelle können auch bei nervigen Gaming-Rätseln helfen

Matthias Bastian

23. Dezember 2025

Short News

Auf GitHub gibt’s eine umfassende Sammlung von "Claude Skills". Diese Skills sind anpassbare Workflows, die Anthropics KI-Assistenten Claude beibringen, bestimmte Aufgaben wiederholt und standardisiert auszuführen. Die Sammlung umfasst mehr als 50 Skills in neun Kategorien: Dokumentenverarbeitung (Word, PDF, PowerPoint), Entwicklungstools (Playwright, AWS, Git), Datenanalyse, Business und Marketing, Kommunikation, kreative Medien, Produktivität, Projektmanagement sowie Sicherheit.

Nutzer können Skills in Claude.ai über die Einstellungen hinzufügen, in Claude Code im Konfigurationsordner ablegen oder per API einbinden. Jeder Skill besteht aus einem Ordner mit einer SKILL.md-Datei. Das Repository steht unter Apache-2.0-Lizenz und nimmt Beiträge entgegen.

Da Skills letztlich nur eine Sammlung von Prompts in einem Ordner sind, gilt: Wer viel aus KI herausholen will, muss die Prompts individualisieren. Inspiration lässt sich dennoch holen. Da Skills sich als Standard zu etablieren scheinen, lohnt es sich auch über Claude.ai hinaus, sich mit dem Thema zu befassen.

Kommentieren Quelle: Github

Jonathan Kemper

23. Dezember 2025

Short News

Zhipu AI stellt mit GLM-4.7 ein auf autonomes Programmieren spezialisiertes KI-Modell vor, das dank "Preserved Thinking" Gedankengänge über lange Dialoge speichert. Diese neue Funktion ergänzt das seit GLM-4.5 bekannte "Interleaved Thinking", bei dem die KI vor Aktionen pausiert. Im Vergleich zum Vorgänger GLM-4.6 erzielt das Modell deutliche Leistungssteigerungen, etwa 73,8 Prozent im SWE-bench Verified. Neben reinem Code generiert GLM-4.7 laut Anbieter auch ästhetisch ansprechendere Webseiten und Präsentationen ("Vibe Coding"). Im Blogbeitrag stellt Zhipu einige Webseiten vor, die aus einem einzigen Prompt entstanden sein sollen.

In mehreren Benchmarks wird das Kopf-an-Kopf-Rennen mit kommerziellen, westlichen Anbietern wie OpenAI und Anthropic deutlich.

Das Modell ist über die Z.ai-Plattform, OpenRouter sowie als lokaler Download auf Hugging Face verfügbar und lässt sich direkt in Coding-Tools wie Claude Code integrieren. Z.ai wirbt dabei mit einem Kampfpreis von einem Siebtel der Kosten vergleichbarer Modelle.

Kommentieren Quelle: Zhipu AI

Jonathan Kemper

23. Dezember 2025

Short News

Das Qwen-Team von Alibaba Cloud hat zwei neue KI-Modelle veröffentlicht, die Stimmen per Textbefehl entwerfen oder klonen. Das Modell Qwen3-TTS-VD-Flash erlaubt es Nutzern, Stimmen durch detaillierte Beschreibungen zu generieren und dabei Eigenschaften wie Emotionen und Sprechtempo exakt festzulegen, etwa: "Male, middle-aged, booming baritone - hyper-energetic infomercial voice with rapid-fire delivery and exaggerated pitch rises, dripping with salesmanship". Es soll laut Hersteller in Tests besser abschneiden als OpenAIs im Frühjahr eingeführte API für GPT-4o-mini-tts.

Ergänzend kopiert das Modell Qwen3-TTS-VC-Flash Stimmen anhand von nur drei Sekunden Audio-Material und gibt diese in zehn Sprachen, darunter Deutsch, wieder. Qwen gibt an, dass die Fehlerrate dabei geringer ist als bei Elevenlabs oder MiniMax. Die KI verarbeitet auch komplexe Texte und kann sogar Tierstimmen imitieren oder Stimmen aus Aufnahmen extrahieren. Beide Modelle sind über die API von Alibaba Cloud verfügbar. Demos stehen sowohl für das Design- als auch das Klon-Modell auf Hugging Face bereit.

Kommentieren Quelle: Qwen

Matthias Bastian

23. Dezember 2025

Praxis

Ex-Tesla-KI-Chef Andrej Karpathy gibt KI-Start-ups vier Tipps für den Wettbewerb mit OpenAI und Co.

Matthias Bastian

23. Dezember 2025

Praxis

OpenAI wehrt sich gegen Prompt-Injections, die das "agentische Web" bedrohen

OpenAI kämpft mit automatisiertem Red Teaming gegen Prompt Injections in ChatGPT Atlas. Das Unternehmen vergleicht das Problem mit Online-Betrug und verharmlost damit eine technische Sicherheitslücke, die das agentische Web ausbremsen könnte.

Vollständigen Artikel lesen

Kommentieren