Inhalt
summary Zusammenfassung

Das US-Start-up Suno hat sich auf KI-Audiogenerierung aus Text spezialisiert. Das neueste Audiomodell erzeugt zum Teil beeindruckende Songs.

Anzeige

Anfang September stellte Suno sein neuestes Text-zu-Song-Modell Chirp v1 vor: Es kann Musik samt Gesang anhand von Textvorgaben zu Stil und Liedtext generieren. Die größte Neuerung ist, dass v1 Genres wie Rock, Pop, K-Pop sowie Beschreibungen wie melodisch oder schnell in Musik umsetzen kann.

Video: Chirp prompted by THE DECODER

Texte können nun mit Befehlen wie [verse] und [chorus] in Strophen unterteilt werden, um den generierten Songs mehr Struktur zu geben. Der Text kann entweder selbst eingetippt oder direkt in der Chirp-Oberfläche von ChatGPT mithilfe eines Prompts generiert werden.

Anzeige
Anzeige

Das Start-up betont, dass Prompts mit konkretem Künstlerbezug nicht unterstützt werden, wohl auch um Copyright-Diskussionen zu vermeiden. Die kamen unter anderem auf, als ein KI-generierter Song mit den Stimmen von "Drake" und "the Weeknd" viral ging und daraufhin von der Universal Music Group gesperrt wurde.

KI-Song-Generierung bei Discord

Ähnlich wie bei Midjourney ist die Chirp-Generierung vollständig in Discord integriert. Für jeden Chirp-Befehl generiert das Modell zwei Vorschläge, die in der Regel zwischen 20 und 40 Sekunden lang sind. Gefällt eine Variante, kann sie mit einem Klick auf "Continue" fortgesetzt werden. Die fertigen Songs können zwischen zwei und drei Minuten lang sein.

Einige besonders gelungene Demos des neuen Modells demonstriert Suno auf einer Website. Wer sich inspirieren lassen oder die Möglichkeiten von Chirp kennenlernen möchte, kann auch einfach auf den Discord-Servern stöbern - mehr als 40.000 Nutzerinnen und Nutzer sorgen für ständigen Song-Nachschub.

Da findet sich das eine oder andere Kleinod, wie dieses politisch motivierte Liebeslied. Ob wir es bald öfter hören werden?

Video: via Chirp

Empfehlung

Oder man nimmt bestehende Texte bekannter Lieder und lässt sie von der KI in einem neuen musikalischen Stil generieren.

Video: via Chirp

Die Komplexität der Songs in Kombination mit der Qualität der generierten Stimmen ist teilweise beeindruckend. Zwar ist hier noch kein Chartstürmer dabei, aber bei dem derzeitigen Entwicklungstempo der generativen KI kann sich das schnell ändern.

Suno unterstützt mehr als 50 Sprachen, wobei Englisch und Rockmusik in meinen Tests am besten abschnitten. Darüber hinaus scheint auch der Inhalt bzw. die Struktur der Strophen den Stil zu beeinflussen. Zu jedem Audioclip wird auf Basis des Textes ein passendes Hintergrundbild generiert.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Kostenlose Chirps auf Discord

Suno bietet auf Discord 250 kostenlose Credits pro Monat an, was 25 Chirps entspricht. Die Generierung ist entweder auf dem öffentlichen Server oder in den Discord DMs möglich. Ein Pro-Plan bietet 1000 Credits / bis zu 100 Chirps pro Monat und kostet 10 Dollar pro Monat. Weitere Generierungen können hinzugekauft werden. Mehr Informationen zu den Bezahlmodellen gibt es hier.

Mit Bark hat Suno im Frühjahr ein Text-to-Speech- und Sound-Modell vorgestellt, das auf Github unter MIT License frei verfügbar ist und kommerziell genutzt werden darf.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das US-Start-up Suno hat mit Chirp v1 ein Text-to-Song-KI-Modell vorgestellt, das Musik und Gesang auf der Grundlage von Stil- und Textvorgaben generieren kann.
  • Chirp v1 kann Genres wie Rock, Pop und K-Pop sowie Beschreibungen wie melodisch oder schnell in Musik umsetzen und den Text in Strophen aufteilen, um den Songs mehr Struktur zu geben.
  • Die Songgenerierung ist vollständig in Discord integriert, wobei Suno 250 kostenlose Credits pro Monat anbietet, was 25 Chirps entspricht. Der Pro-Plan mit 1000 Credits / bis zu 100 Chirps monatlich kostet 10 Dollar pro Monat.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!