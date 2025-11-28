Générer une vidéo avec l’IA Sora : toutes ces choses qui peuvent mal tourner

Beaucoup ont testé Sora dès que l’application s’est ouverte sur mobile. Il y en a par exemple qui a glissé son visage et sa voix pour tourner une scène complètement absurde. Un avatar poursuivi par des pensionnaires armés de pistolets à peinture.

Le résultat a été amusant, bien sûr, sauf que cela a aussi entraîné autre chose. Entre énergie, eau, filtres défaillants et risques de canulars, la joie du montage a vite tourné au drôle de vertige.

Vous appuyez sur générer… voici ce que vous consommez

Première surprise : une vidéo Sora grignote autant d’électricité qu’un téléviseur géant allumé pendant une bonne demi-heure. CNET évoque près de 90 wattheures pour une seule requête.

Le Wall Street Journal avance une fourchette entre 20 et 100. La vérité exacte échappe à tout le monde, car OpenAI garde pour elle plusieurs données clés. Sasha Luccioni, chercheuse chez Hugging Face, critique d’ailleurs ces calculs flous.

Elle estime que la communauté s’épuise à deviner des chiffres jamais publiés. Le problème, selon elle, vient du manque de transparence autour de l’empreinte réelle des modèles.

Les utilisateurs consument de l’énergie sans savoir l’ampleur du phénomène. Chaque génération repose pourtant sur ces machines énergivores dont on ignore les besoins exacts.

Il faut aussi distinguer l’exécution d’un modèle de son entraînement. Une vidéo génère un coût au moment du calcul, ce que l’on appelle l’inférence. L’entraînement consomme un volume différent, bien plus massif.

GPT-4 a absorbé près de 50 gigawattheures. Une ville comme San Francisco aurait tenu trois jours avec autant. Sora, spécialisé dans la vidéo, dépasse probablement ce seuil. En appuyant sur le bouton, on porte donc une part infinitésimale de cet héritage énergétique.

Quoi d’autres ?

Autre sujet qui pique : l’eau utilisée pour refroidir les serveurs. Les centres de données avalent des quantités astronomiques, peu importe le système choisi. Le volume exact dépend du lieu, du matériel et du type de refroidissement. Impossible donc de savoir quel bassin virtuel vous avez fait transpirer.

Sam Altman tente une comparaison simple : une requête textuelle consommerait un quinzième de cuillère à café. CNET estime qu’une vidéo coûte deux mille fois plus. On atteindrait alors près de 650 ml d’eau. Une petite bouteille de soda évaporée pour chaque génération. Ce calcul reste approximatif, même si l’idée générale suffit à créer un petit pincement écologique.

Les mêmes questions que pour l’électricité reviennent ici. L’entraînement a déjà englouti des volumes inconnus. L’inférence ajoute une couche fraîche à chaque utilisation. Le poids écologique se glisse donc dans chaque clip, aussi court soit-il. Cette charge devient difficile à ignorer une fois qu’on y pense.

Le paradoxe est simple. Des outils grand public simplifient la création vidéo. L’autre face du miroir montre des tuyaux qui chauffent, de l’eau qui circule et des machines qui tournent. Une boucle discrète, déclenchée dès qu’une envie de clip se manifeste.

Vous qui utilisez votre photo pour générer des vidéos, sachez que…

Sora héberge une fonction Cameo. Un utilisateur peut y contrôler sa représentation et définir ce qui est autorisé. Les choix plus restrictifs offrent un espace plus rassurant. On peut même rédiger des consignes détaillées pour encadrer son image.

En revanche, si vous choisissez le réglage « Tout le monde », des généraux créatifs inconnus peuvent utiliser votre photo. Un curieux amateur de deepfakes peut pousser le système dans ses retranchements. Le filtre peut céder par endroits, laissant passer une scène douteuse.

Évidemment, rien n’indique que quelqu’un tentera ce genre d’expérience avec votre image. Toutefois, il vaut mieux être prudent. Les filtres ne sont jamais parfaits. Et vous risquez d’apparaître dans une vidéo sexuelle,une scène violente ou encore des contenus extrémistes.

Autre chose. Sora génère sans difficulté des vidéos scatologiques. Aucun garde-fou spécifique ne bloque ces scènes tant qu’elles n’entrent pas dans d’autres catégories sensibles.

Des tests ont montré des clips où une personne manipule des excréments. Le modèle les produit sans protester. Il y a donc aussi des chances que votre photo soit utilisée pour créer ce genre de contenu.

Le pire c’est que votre vidéo peut servir à un canular mondial. Une vidéo mise en ligne peut voyager sans limite. Les utilisateurs la téléchargent, l’importent ailleurs et lui donnent un sens nouveau. On a déjà vu un faux Donald Trump hurler au scandale devant la Maison Blanche. La vidéo, réalisée avec Sora, a convaincu plusieurs internautes.

Le créateur du clip affirmait pourtant qu’il s’agissait d’un exercice artistique. Les réseaux, eux, ont transformé l’extrait en rumeur politique. L’intention initiale disparaît aussitôt qu’il quitte la plateforme. Une vidéo humoristique se transforme alors en pièce de théâtre mondiale, portée par des interprétations parfois très éloignées.

