GAN-Netzwerke beweisen erneut ihr schöpferisches Potenzial: Eine KI verpasst Songtexten passende Melodien.
Ihr seid gute Poeten, aber habt keine Musik im Blut? Dank zweier Wissenschaftler aus Japan und der Schweiz steht euch vielleicht doch noch eine Karriere in der Musikindustrie offen. Die Forscher haben eine KI trainiert, die Melodien aus Texten generiert.
Für das Training nutzten die Forscher insgesamt etwa 12.000 mit Songtexten verknüpfte MIDI-Dateien. Für ihre KI-Architektur verwendeten sie die von Deepfakes bekannten GAN-Netzwerke.
Das Generator-Netzwerk der GAN-KI versucht zu gegebenen Songtexten Melodien zu erzeugen, das Diskriminator-Netzwerk vergleicht diese mit den Trainingsdaten. Liegt das Klangergebnis weit ab der von Menschen komponierten Musik, verwirft der Diskriminator die KI-Musik - und der Generator muss erneut ran.
Noch kein Bon Jovi
Die Ergebnisse der Musik-KI sind tatsächlich erträglich. Im Vergleich zu anderen KIs, die nicht auf GAN-Netzwerke setzen, ist ein eindeutiger Fortschritt hörbar. An die Melodie des Originals kommt die KI aber noch nicht ran – zumindest meiner Meinung nach.
Alternative KI
GAN-Netzwerk
Original
Wenn die Weiterentwicklung der durch GAN-Netzwerke angetriebenen Bild-KIs ein Hinweis ist, könnten KI-gestützte Musikgeneratoren schnell besser werden - und die Musikindustrie beeinflussen. OpenAIs MuseNet, KI-Deathmetal und KI-Musiktools wie AIVA deuten das Potenzial an.
Die Forscher wollen ihre KI in Zukunft weiter ausbauen, um etwa polyphone Melodien zu generieren oder zu bereits vorhandenen Melodien passende Songtexte zu schreiben.
Quelle: Arxiv.org