Anzeige
Short

OpenAI hat sein Sprachmodell GPT-4o in ChatGPT aktualisiert. Das Update erweitert den Trainingsdatensatz bis Juni 2024, was zu aktuelleren und kontextbezogeneren Antworten führen soll. Zudem wurde die Bilderkennung verbessert, sodass GPT-4o räumliche Beziehungen, Diagramme und Grafiken besser analysieren und mit Textinhalten verknüpfen kann. Dies soll zu präziseren Ergebnissen bei visuell gesteuerten Aufgaben führen. Das aktualisierte Modell schneidet laut OpenAI bei mathematischen, naturwissenschaftlichen und programmierbezogenen Problemen sowie bei Benchmarks für Sprachverständnis und logisches Denken besser ab. Außerdem verwendet GPT-4o häufiger Emojis, insbesondere wenn der Nutzer diese in der Konversation einsetzt. In der Chat-Oberfläche gibt es jetzt auch einen "Use more intelligence"-Button, der das Modell zum "Nachdenken" anregt, bevor es antwortet. Das neue Modell ist noch nicht in der API-Dokumentation aufgeführt.

Anzeige
Anzeige
Anzeige
Anzeige
Short

YuE ist eine Open-Source-Alternative zu Diensten wie Suno oder Udio. Laut dem beteiligten Entwickler Ruibin Yuan funktioniert es in mehreren Sprachen und Musikstilen und kann bis zu fünf Minuten Audio auf Grundlage von Songtexten generieren. Das Programm nutzt zwei KI-Modelle: Eines verarbeitet Sprache und Musik, das andere kümmert sich um weitere Details. YuE kann verschiedene Gesangstechniken nachahmen und Nutzer können den Musikstil, die Stimmung und die Art der Stimme bestimmen. YuE ist auf HuggingFace verfügbar, viele Beispiele auf GitHub. Ein Paper soll folgen.

Anzeige
Anzeige
Google News