Neue Facebook-KI zerlegt Musik in ihre Einzelteile

7. März 2020

Eine neue Facebook-KI kann es Musikern und Produzenten zukünftig erleichtern, Songs nachzuvollziehen.

Der Bass wummert, das Schlagzeug poltert, die Sängerin schmettert, die E-Gitarre schneidet - bei einem Song werden viele Stimmen zu einer. Als Zuhörer denkt man nicht mehr darüber nach, dass sich dieses Gesamtbild aus vielen einzelnen Noten und Klängen zusammensetzt.

Zumindest der normale Zuhörer nicht: Musiker oder Produzenten hingegen können sehr wohl ein Interesse daran haben, jedes Instrument einzeln zu hören und zu analysieren, beispielsweise um einen bestimmten Rhythmus zu identifizieren oder einen Song Note für Note nachzuspielen.

Song-Analyse mit KI-Unterstützung

Sofern man Zugriff auf die Studiomischung hat, ist diese Nachvollziehbarkeit kein Problem: Denn im Studio wird ohnehin jede Spur einzeln aufgezeichnet und am Ende zu einem Gesamtwerk abgemischt. Aber wann hat man diesen Zugriff schon?

Facebooks KI-Forscher Alexandre Defossez entwickelt daher die KI-Software "Demucs", die die einzelnen Tracks eines Songs automatisch heraushören und voneinander trennen kann. Der folgende Audio-Track spielt nur das Schlagzeug aus diesem Song ab.

Hier könnt ihr den Bass und die Stimme anhören, die ebenfalls mit Demucs aus dem Song separiert wurden.

Interessant ist, dass die KI diese Herausforderung - obwohl es sich um Audio handelt - visuell annimmt: Sie untersucht die Wellenform der Klänge auf komplexe Muster und entwickelt so ein Verständnis dafür, welches Muster zu welchem Instrument gehört.

Vom Song zum Erdbeben

Laut Defossez kann das Analyseverfahren auch für andere Zwecke genutzt werden, beispielsweise damit KI-Assistenten einzelne Stimmen in einer lauten Umgebung heraushören können. Eine ähnliche Forschungsarbeit stellten KI-Forscher von Google im April 2018 vor.

Mit dem Verfahren hinter Demucs könnten laut Defossez auch die Wellenmuster von Seismographen analysiert werden, um Erdbeben genauer zu untersuchen. Ziel seiner Forschung sei es, dass KI Audio ebenso zuverlässig zu analysieren lernt, wie sie Objekte auf Fotos identifizieren kann.

Wer sich für Defossez genaues Vorgehen beim KI-Training interessiert, findet hier seine wissenschaftliche Veröffentlichung. Bis auf weiteres bleibt Demucs Forschungsarbeit und ist kostenlos bei Github verfügbar.

Quelle & Titelbild: Facebook

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Neue Facebook-KI zerlegt Musik in ihre Einzelteile

Song-Analyse mit KI-Unterstützung

Vom Song zum Erdbeben

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.