Anzeige
Short

Elevenlabs hat „ElevenLabs UI“ veröffentlicht – eine Open-Source-Bibliothek mit 22 Komponenten für Sprach- und Audioanwendungen. Laut dem Unternehmen lassen sich damit schnell Benutzeroberflächen für Chatbots, Transkription, Musik oder Sprachagenten aufbauen. Die Module sind vollständig anpassbar und unter MIT-Lizenz verfügbar. Grundlage ist das Framework shadcn/ui.

Beispiele sind „transcriber-01“, ein in Web-Apps einsetzbares Diktatmodul, und „voice-chat-03“, eine Chatoberfläche mit integriertem Zustandsmanagement. Weitere Bausteine wie Audio-Player, Konversationsleisten und interaktive Visualisierungen stehen auf ui.elevenlabs.io bereit.

Entwickler können den Quellcode frei nutzen, anpassen und in eigene Projekte einbinden.

Anzeige
Anzeige
Short

Microsoft hat auf dem OpenAI DevDay im Oktober 2025 mehrere neue multimodale KI-Modelle für Azure AI Foundry vorgestellt. Das Update umfasst die Modelle GPT-image-1-mini, GPT-realtime-mini und GPT-audio-mini sowie Sicherheitsverbesserungen für GPT-5-chat-latest und das Analysemodell GPT-5-pro. Damit sollen Entwickler KI-Anwendungen für Text, Bild, Audio und Video schneller und günstiger umsetzen können.

Das Microsoft Agent Framework, ein Open-Source-SDK zur Koordination mehrerer KI-Agenten, sowie OpenAIs neues Agent SDK sind ebenfalls verfügbar.

Anzeige
Anzeige
Short

OpenAI erweitert seine Video-App Sora um neue Kontrollfunktionen. Nutzer können laut Sora-Teamchef Bill Peebles nun festlegen, in welchen Kontexten KI-Versionen ihrer selbst erscheinen dürfen – etwa keine politischen Inhalte oder bestimmte Wörter. Auch Stilvorgaben sind möglich. Die Anpassungen folgen auf Kritik an missbräuchlichen Deepfakes in der App. Parallel erklärte Peebles, dass Sora künftig offiziell Cameos mit urheberrechtlich geschützten Charakteren ermöglichen soll. Erst kürzlich hatte CEO Sam Altman angekündigt Rechteinhaber sollten „mehr Kontrolle“ und bald auch eine Beteiligung an den Erlösen erhalten.

Anzeige
Anzeige
Google News