Jukebox est une nouvelle intelligence artificielle créée par OpenAI. Elle est capable de générer de la musique, mais aussi des paroles pour créer une chanson pop…
L'an dernier, OpenAI dévoilait son intelligence artificielle MuseNet capable de générer de la musique en jouant jusqu'à 10 instruments dans une quinzaine de styles différents.
À présent, les chercheurs de la firme dévoilent une nouvelle IA musicale dénommée Jukebox. Contrairement à MuseNet, ce nouveau modèle est capable de générer des paroles en plus de la musique…
Pour parvenir à cette prouesse, les chercheurs ont entraîné Jukebox à partir d'un ensemble de données brutes issu de 1,2 million de chansons. Contrairement à MuseNet qui avait été entraîné à partir de données de » musique symbolique « , Jukebox a donc été nourri à partir d'audio brut.
Cet audio a été encodé et compressé à l'aide d'un réseau de neurones convolutionnel. Puis, un » transformateur » a permis de générer un nouveal audio compressé qui sera ensuite à nouveau transformé en audio brut.
Jukebox marque un nouveau cap pour l'IA créative
Pour permettre au modèle Jukebox de recréer la voix des chanteurs, les chercheurs ont utilisé les métadonnées et les lyrics extraits du site » LyricsWiki « . À présent, Jukebox est capable d'imiter un artiste pop comme Katy Perry, Elvis Presley ou Nas. Il est aussi capable de compléter une chanson après avoir en analysé les premières secondes…
Le résultat est plutôt impressionnant, mais reste pour l'instant limité du propre aveu des chercheurs d'OpenAI. Cette IA » représente un pas en avant en termes de qualité, de cohérence musicale, de longueur de l'extrait audio et de capacité à imiter un artiste, un genre ou une plume de parolier « , mais elle n'est pas encore capable de recréer la structure d'une chanson avec ses couplets, ses ponts et son refrain.
- Partager l'article :