Anzeige
Short

Nvidia hat mit der Einführung der RTX 50-Serie DLSS 4 sowie Updates für seine Broadcast-App veröffentlicht. Die neue Version der KI-basierten Upscaling-Technologie verwendet ein neues Transformer-Modell, das eine bessere Bildqualität liefern soll. Mit DLSS 4 Overrides können Nutzerinnen und Nutzer in 75 unterstützten Spielen ihre DLSS-Version auf das neueste Modell aktualisieren. Nvidia hat außerdem ein Update für die KI-basierte Anwendung Nvidia Broadcast veröffentlicht, die die KI-Fähigkeiten der RTX-Grafikkarten nutzt, um Hintergrundgeräusche und visuelle Störungen bei Videokonferenzen oder Livestreams in Echtzeit herauszufiltern und so die Audio- und Videoqualität zu verbessern. Zu den Neuerungen gehören ein Studio-Recording-Modus, der ein hochwertiges Aufnahmestudio simulieren soll, sowie eine Rauschunterdrückung für Videos und ein virtuelles Key-Light, das das Gesicht des Nutzers per KI beleuchtet und Schatten reduziert. Außerdem gibt es Updates für RTX Video Super Resolution, eine Anwendung, die Videos hochskaliert.

Short

OpenAI hat sein Sprachmodell GPT-4o in ChatGPT aktualisiert. Das Update erweitert den Trainingsdatensatz bis Juni 2024, was zu aktuelleren und kontextbezogeneren Antworten führen soll. Zudem wurde die Bilderkennung verbessert, sodass GPT-4o räumliche Beziehungen, Diagramme und Grafiken besser analysieren und mit Textinhalten verknüpfen kann. Dies soll zu präziseren Ergebnissen bei visuell gesteuerten Aufgaben führen. Das aktualisierte Modell schneidet laut OpenAI bei mathematischen, naturwissenschaftlichen und programmierbezogenen Problemen sowie bei Benchmarks für Sprachverständnis und logisches Denken besser ab. Außerdem verwendet GPT-4o häufiger Emojis, insbesondere wenn der Nutzer diese in der Konversation einsetzt. In der Chat-Oberfläche gibt es jetzt auch einen "Use more intelligence"-Button, der das Modell zum "Nachdenken" anregt, bevor es antwortet. Das neue Modell ist noch nicht in der API-Dokumentation aufgeführt.

Anzeige
Anzeige
Anzeige
Anzeige
Short

YuE ist eine Open-Source-Alternative zu Diensten wie Suno oder Udio. Laut dem beteiligten Entwickler Ruibin Yuan funktioniert es in mehreren Sprachen und Musikstilen und kann bis zu fünf Minuten Audio auf Grundlage von Songtexten generieren. Das Programm nutzt zwei KI-Modelle: Eines verarbeitet Sprache und Musik, das andere kümmert sich um weitere Details. YuE kann verschiedene Gesangstechniken nachahmen und Nutzer können den Musikstil, die Stimmung und die Art der Stimme bestimmen. YuE ist auf HuggingFace verfügbar, viele Beispiele auf GitHub. Ein Paper soll folgen.

Anzeige
Anzeige
Google News