Anzeige
Short

Apple hat 20 neue Core ML-Modelle und 4 Datensätze auf der Hugging Face-Plattform veröffentlicht, um Entwickler bei der Erstellung von KI-Anwendungen zu unterstützen, die direkt auf den Geräten ausgeführt werden. Die Modelle decken Bereiche wie Bildklassifikation, Tiefensegmentierung und semantische Segmentierung ab und wurden für die Ausführung auf Apple-Geräten ohne Netzwerkverbindung optimiert. Apple arbeitet eng mit Hugging Face zusammen, um Initiativen wie die MLX-Community und die Integration von Open-Source-KI in Apple Intelligence-Funktionen voranzutreiben.

Anzeige
Anzeige
Short

Camb AI, ein in Dubai ansässiges Start-up-Unternehmen, das KI-gestützte Technologien für die Lokalisierung von Inhalten erforscht, hat sein Sprachklonmodell Mars5 vorgestellt. Laut Camb bietet Mars5 einen höheren Realismus als das Konkurrenzprodukt von ElevenLabs und unterstützt 140 Sprachen, darunter auch ressourcenarme Sprachen wie Isländisch und Swahili. Mars5 unterstützt Sprachcloning und Text-to-Speech. Der Benutzer lädt eine Audiodatei hoch und gibt den Textinhalt an. Das Modell erfasst dann Stimme, Sprechstil, Emotion und Bedeutung und synthetisiert den Text mit der Stimme des Sprechers. Camb hat auch eine quelloffene Version von Mars5 auf GitHub veröffentlicht, die allerdings nur Englisch unterstützt.

Short

McDonald’s beendet sein gemeinsam mit IBM gestartetes KI-Bestellsystem für den Drive Thru. Nach einem zweijährigen Test der automatisierten Spracherkennung in über 100 Restaurants wird die Technologie bis zum 26. Juli 2024 abgeschaltet. Ziel war es, den Drive-Thru-Service zu beschleunigen und die Prozesse zu vereinfachen. McDonald’s sieht jedoch weiterhin Potenzial für eine breitere Erforschung von Sprachbestelllösungen und will bis Ende des Jahres einen neuen Partner finden. Auch IBM führt nach eigenen Angaben Gespräche mit anderen Fast-Food-Ketten. Das klingt, als seien die Partner nicht im Guten auseinandergegangen.

Short

Anthropic testet eine vollkommen neue Steuerungsmöglichkeit für LLMs. Das KI-Startup bietet Entwicklern Zugang zu seiner Beta Steering API, mit der die internen Funktionen von Sprachmodellen angepasst werden können. Die API basiert auf aktuellen Forschungsergebnissen zur Steuerbarkeit von Sprachmodellen. Durch die Verstärkung einzelner Konzepte in Modellen kann deren Generierung stark beeinflusst werden.

Interessierte Entwickler erhalten Zugriff auf eine Untermenge der internen Funktionen von Claude, Dokumentation, Beispielcode und eventuell einen Slack-Kanal zum Austausch mit dem Anthropic-Team. Im Gegenzug werden die Tester gebeten, ihre Projekte mit Anthropic zu teilen und Feedback zu geben. Die Technologie befindet sich noch im Forschungsstadium und ist nicht für den produktiven Einsatz vorgesehen. Anthropic betont, dass die API jederzeit verändert oder eingestellt werden kann.

Anzeige
Anzeige
Anzeige
Anzeige
Google News