Bildnachweis: Jason Alden/Bloomberg/Getty Images
Kann KI von einer Textbeschreibung aus rückwärts arbeiten, um einen zusammenhängenden Song zu generieren? Dies ist der Ausgangspunkt MusicLMdas KI-gestützte Musikerstellungstool, das Google gestern während seines I/O-Kick-offs vorgestellt hat.
MusicLM, das in Hunderttausenden Audiostunden trainiert wurde, um das Erstellen neuer Musik in verschiedenen Stilrichtungen zu erlernen, ist in der Vorschau über die Google AI Test Kitchen-App verfügbar. Ich spiele seit etwa einem Tag damit, ebenso wie einige meiner Freunde.
Urteil? Sagen wir einfach, dass MusicLM in absehbarer Zeit keine Musikerjobs bekommen wird.
Die Verwendung von MusicLM in der Testküche ist sehr einfach. Sobald der Zugriff genehmigt wurde, werden Sie mit einem Textfeld begrüßt, in das Sie eine Beschreibung des Songs eingeben können – so detailliert Sie möchten – und das System zwei Versionen des Songs erstellen lässt. Beide können zum Offline-Hören heruntergeladen werden, Google empfiehlt Ihnen jedoch, einen Titel zu „liken“, um die Leistung der KI zu verbessern.
Als ich im Januar vor der Veröffentlichung zum ersten Mal über MusicLM berichtete, schrieb ich, dass die Songs des Systems so klingen, als ob ein menschlicher Künstler sie komponieren würde – wenn auch nicht unbedingt musikalisch einfallsreich oder kohärent. Nun kann ich nicht sagen, dass ich diesen Worten voll und ganz treu bin, da bei den Proben von Anfang des Jahres offensichtlich eine ernsthafte Rosinenpickerei stattgefunden zu haben scheint.
Die meisten Songs, die ich mit MusicLM erstellt habe, klingen bestenfalls passabel – und im schlimmsten Fall wie die verlorenen Songs eines Vierjährigen DAW. Ich habe mich hauptsächlich an EDM gehalten und versucht, etwas mit einer klaren Struktur und Melodie (und idealerweise auch sanft) zu liefern. Aber egal wie anständig – sogar gut! – Klingt wie der Anfang der Songs von MusicLM, es kommt ein Moment, in dem die Songs auf sehr offensichtliche und musikalisch unangenehme Weise auseinanderfallen.
Nehmen Sie zum Beispiel diese Vorlage, die mit einem „EDM-Song in einem leichten, fröhlichen, luftigen Stil, gut zum Tanzen“ erstellt wurde. Es beginnt vielversprechend, mit einer kopfschüttelnden Grundlinie und Elementen eines klassischen Daft-Punk-Songs. Aber in der Mitte des Kurses weicht es vom Kurs ab – praktisch von einer anderen Art.
Dies ist ein Klaviersolo aus einer einfacheren Welle – „Romantische und sentimentale Klaviermusik“. Sie werden feststellen, dass die Teile gut und gut klingen – sogar außergewöhnlich, zumindest was die Fingerarbeit angeht. Aber dann ist es, als ob der Pianist von einer Manie besessen wäre. Ein Notenmix später nimmt das Lied eine völlig andere Richtung ein, als stamme es von einem neuen Notenblatt – wenn auch ähnlich dem Original.
Ich habe mich bei MusicLM an Chiptunes versucht, um das auszuprobieren, und dachte, dass die KI bei Songs mit einem einfachen Aufbau vielleicht einfacher wäre. Wir würfeln nicht. Das Ergebnis (unten) war zwar teilweise attraktiv, erwies sich jedoch als ebenso zufällig wie die anderen Stichproben.
Positiv zu vermerken ist, dass MusicLM im Allgemeinen einen viel besseren Job macht als Jukebox, den Versuch von OpenAI vor einigen Jahren, einen KI-Musikgenerator zu entwickeln. Im Gegensatz zu MusicLM kann Jukebox aufgrund des Genres, des Interpreten und des Textausschnitts relativ kohärente Musik mit Gesang erzeugen, aber den von Jukebox produzierten Songs fehlen typische musikalische Elemente wie Refrains, die wiederholt werden und oft enthalten sind Unsinnige Worte. Von MusicLM produzierte Songs weisen auch weniger Artefakte auf und fühlen sich im Hinblick auf die Wiedergabetreue im Allgemeinen wie eine Verbesserung an.
Darüber hinaus ist der Nutzen von MusicLM aufgrund künstlicher Einschränkungen auf der Stimulusseite etwas eingeschränkt. Musik mit Künstlern oder Gesang würde nicht geboren werden, nicht einmal in Stil bestimmte Musiker. Versuchen Sie, eine Eingabeaufforderung wie „ähnlich wie Barry Manilow“ einzugeben, und Sie erhalten nur eine Fehlermeldung.
Der Grund ist wahrscheinlich legal. Denn für gefälschte Musik gibt es eine unklare Rechtsgrundlage, da einige in der Musikindustrie argumentieren, dass KI-gestützte Musikgeneratoren wie MusicLM Musikurheberrechte verletzen. Es wird möglicherweise nicht lange dauern, bis in dieser Angelegenheit Klarheit herrscht – mehrere Klagen, die vor Gericht eingereicht werden, werden wahrscheinlich Auswirkungen auf die musikerzeugende KI haben, darunter ein Fall über die Rechte von Künstlern, deren Arbeit zum Trainieren von KI-Systemen verwendet wird sie. . Wissen oder Einwilligung. Wir werden sehen.
„Unruhestifter. Begeisterter Popkultur-Fan. Fernseh-Junkie. Bierliebhaber. Analytiker. Vollkommener Speckgelehrter. Denker.“
More Stories
Nur sieben Charaktere schafften es nicht in die Top 64 des Tekken 8-Turniers bei Evo Japan 2024, aber es handelt sich nicht alle um niedrige Ränge
Folgendes geschah offenbar, als die Twitch-Streams von Evo Japan 2024 während der Übertragungsperiode des zweiten Tages kurzzeitig gesperrt wurden
Apples „Let Loose“-Event für das iPad soll Berichten zufolge auch eine Sonderveranstaltung in London beinhalten