Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
DEEP MINDS #13: KI in Deutschland & Aleph Alpha

GAN-Netzwerke beweisen erneut ihr schöpferisches Potenzial: Eine KI verpasst Songtexten passende Melodien.

Ihr seid gute Poeten, aber habt keine Musik im Blut? Dank zweier Wissenschaftler aus Japan und der Schweiz steht euch vielleicht doch noch eine Karriere in der Musikindustrie offen. Die Forscher haben eine KI trainiert, die Melodien aus Texten generiert.

Für das Training nutzten die Forscher insgesamt etwa 12.000 mit Songtexten verknüpfte MIDI-Dateien. Für ihre KI-Architektur verwendeten sie die von Deepfakes bekannten GAN-Netzwerke.

Das Generator-Netzwerk der GAN-KI versucht zu gegebenen Songtexten Melodien zu erzeugen, das Diskriminator-Netzwerk vergleicht diese mit den Trainingsdaten. Liegt das Klangergebnis weit ab der von Menschen komponierten Musik, verwirft der Diskriminator die KI-Musik – und der Generator muss erneut ran.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Der Generator erzeugt MIDI-Sequenzen, der Diskriminator bewertet sie. Diese Arbeitsteilung ist von Deepfakes bekannt. Bild: Yu et al.
Der Generator erzeugt MIDI-Sequenzen, der Diskriminator bewertet sie. Diese Arbeitsteilung ist von Deepfakes bekannt. Bild: Yu et al.

Noch kein Bon Jovi

Die Ergebnisse der Musik-KI sind tatsächlich erträglich. Im Vergleich zu anderen KIs, die nicht auf GAN-Netzwerke setzen, ist ein eindeutiger Fortschritt hörbar. An die Melodie des Originals kommt die KI aber noch nicht ran – zumindest meiner Meinung nach.

Alternative KI

GAN-Netzwerk

Original

Wenn die Weiterentwicklung der durch GAN-Netzwerke angetriebenen Bild-KIs ein Hinweis ist, könnten KI-gestützte Musikgeneratoren schnell besser werden – und die Musikindustrie beeinflussen. OpenAIs MuseNet, KI-Deathmetal und KI-Musiktools wie AIVA deuten das Potenzial an.

Empfehlung

Die Forscher wollen ihre KI in Zukunft weiter ausbauen, um etwa polyphone Melodien zu generieren oder zu bereits vorhandenen Melodien passende Songtexte zu schreiben.

Quelle: Arxiv.org

Weiterlesen über Künstliche Intelligenz:

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!