Anzeige
Skip to content
Read full article about: TikTok führt KI-Avatare für Werbung ein

TikTok hat Symphony Digital Avatars eingeführt, ein generatives KI-Tool, mit dem Kreative und Marken KI-Avatare von realen Personen für Markeninhalte erstellen können. Das Tool bietet Stock-Avatare, vorgefertigte Avatare, die mit bezahlten Schauspielern erstellt wurden, und benutzerdefinierte Avatare, die einen Kreativen oder einen Markensprecher repräsentieren. Mit dem KI-Tool Symphony AI Dubbing können die Inhalte in über 10 Sprachen übersetzt werden. TikTok gründet außerdem das Symphony Collective, ein Beratungsgremium aus Branchenvertretern und Creatorn, um Feedback zu den KI-Marketing-Lösungen von TikTok zu geben.

https://www.tiktok.com/@tiktoknewsroom/video/7381474944737398062?is_from_webapp=1&sender_device=pc&web_id=7381807414746039840

Read full article about: Apple veröffentlicht 20 neue KI-Modelle, die auf Endgeräten laufen

Apple hat 20 neue Core ML-Modelle und 4 Datensätze auf der Hugging Face-Plattform veröffentlicht, um Entwickler bei der Erstellung von KI-Anwendungen zu unterstützen, die direkt auf den Geräten ausgeführt werden. Die Modelle decken Bereiche wie Bildklassifikation, Tiefensegmentierung und semantische Segmentierung ab und wurden für die Ausführung auf Apple-Geräten ohne Netzwerkverbindung optimiert. Apple arbeitet eng mit Hugging Face zusammen, um Initiativen wie die MLX-Community und die Integration von Open-Source-KI in Apple Intelligence-Funktionen voranzutreiben.

Read full article about: Mars5 soll ElevenLabs schlagen - und ist für Englisch kostenlos

Camb AI, ein in Dubai ansässiges Start-up-Unternehmen, das KI-gestützte Technologien für die Lokalisierung von Inhalten erforscht, hat sein Sprachklonmodell Mars5 vorgestellt. Laut Camb bietet Mars5 einen höheren Realismus als das Konkurrenzprodukt von ElevenLabs und unterstützt 140 Sprachen, darunter auch ressourcenarme Sprachen wie Isländisch und Swahili. Mars5 unterstützt Sprachcloning und Text-to-Speech. Der Benutzer lädt eine Audiodatei hoch und gibt den Textinhalt an. Das Modell erfasst dann Stimme, Sprechstil, Emotion und Bedeutung und synthetisiert den Text mit der Stimme des Sprechers. Camb hat auch eine quelloffene Version von Mars5 auf GitHub veröffentlicht, die allerdings nur Englisch unterstützt.

Read full article about: McDonald's beendet KI-Experiment am Drive-Thru - Suche nach neuem Partner läuft

McDonald’s beendet sein gemeinsam mit IBM gestartetes KI-Bestellsystem für den Drive Thru. Nach einem zweijährigen Test der automatisierten Spracherkennung in über 100 Restaurants wird die Technologie bis zum 26. Juli 2024 abgeschaltet. Ziel war es, den Drive-Thru-Service zu beschleunigen und die Prozesse zu vereinfachen. McDonald’s sieht jedoch weiterhin Potenzial für eine breitere Erforschung von Sprachbestelllösungen und will bis Ende des Jahres einen neuen Partner finden. Auch IBM führt nach eigenen Angaben Gespräche mit anderen Fast-Food-Ketten. Das klingt, als seien die Partner nicht im Guten auseinandergegangen.

Read full article about: Anthropic testet neue "Beta Steering"-API - neue Steuerungsmöglichkeiten für LLMs

Anthropic testet eine vollkommen neue Steuerungsmöglichkeit für LLMs. Das KI-Startup bietet Entwicklern Zugang zu seiner Beta Steering API, mit der die internen Funktionen von Sprachmodellen angepasst werden können. Die API basiert auf aktuellen Forschungsergebnissen zur Steuerbarkeit von Sprachmodellen. Durch die Verstärkung einzelner Konzepte in Modellen kann deren Generierung stark beeinflusst werden.

Interessierte Entwickler erhalten Zugriff auf eine Untermenge der internen Funktionen von Claude, Dokumentation, Beispielcode und eventuell einen Slack-Kanal zum Austausch mit dem Anthropic-Team. Im Gegenzug werden die Tester gebeten, ihre Projekte mit Anthropic zu teilen und Feedback zu geben. Die Technologie befindet sich noch im Forschungsstadium und ist nicht für den produktiven Einsatz vorgesehen. Anthropic betont, dass die API jederzeit verändert oder eingestellt werden kann.