Le célèbre générateur d'images Midjourney se lance dans la vidéo avec son premier modèle, V1. Disponible via Discord, cet outil transforme des images en courtes vidéos animées, plaçant la startup en concurrence directe avec Sora d'OpenAI et les autres géants du secteur.
Comment fonctionne Midjourney V1 ?
Fidèle à ses habitudes, Midjourney a lancé son outil vidéo directement sur son serveur Discord. Le principe est simple : il s'agit d'un modèle "image-to-video". Vous prenez n'importe quelle image, qu'elle ait été générée par Midjourney ou non, et V1 la transforme en une courte vidéo de cinq secondes.
L'outil propose quelques réglages pour orienter la création. Vous pouvez laisser l'IA décider de l'animation ou décrire manuellement le mouvement que vous souhaitez avec un prompt. Il est également possible de choisir un niveau de mouvement "faible" ou "élevé" et d'étendre la vidéo par tranches de quatre secondes, jusqu'à une durée maximale de 21 secondes.
Une approche artistique, pas photoréaliste
Alors que des concurrents comme Sora ou Veo de Google cherchent à atteindre un réalisme à couper le souffle, Midjourney conserve sa patte artistique. Les premières créations de V1 ne cherchent pas à imiter la réalité, mais proposent plutôt un style "onirique", comme des peintures qui prennent vie.
C'est un choix délibéré de la part de l'entreprise. L'objectif n'est pas de fournir des plans pour des films hollywoodiens, mais de rester un outil au service de la créativité et de l'imagination.
Le prix à payer (et les soucis judiciaires en cours)
Cette nouvelle fonctionnalité a un coût, et il est élevé. Midjourney a annoncé que la génération d'une vidéo consommait huit fois plus de crédits que la génération d'une image. Autant dire que votre abonnement mensuel va fondre beaucoup plus vite. Pour les gros utilisateurs, seuls les abonnements Pro et Mega offrent des générations vidéo illimitées en mode lent.
Pour David Holz, le PDG de Midjourney, la vidéo n'est qu'une étape. Il a expliqué que l'objectif ultime de l'entreprise était de créer des modèles d'IA capables de générer des "simulations de mondes ouverts en temps réel".
Après les images (l'étape 1) et la vidéo (l'étape 2), les prochaines étapes pour Midjourney seront la génération d'objets 3D et les modèles temps réel. Une ambition qui, si elle se réalise, pourrait bien redéfinir la création de jeux vidéo par exemple.
On en dit quoi ?
Midjourney entre enfin sur le marché de la vidéo IA, mais le fait à sa manière : sur Discord, avec un style artistique assumé et sans chercher à copier le photoréalisme de la concurrence. C'est une stratégie maline pour conserver son identité de "bac à sable créatif" face aux géants qui visent le marché professionnel. Reste que la startup fait face aux mêmes problèmes que les autres : le coût de calcul exorbitant de la vidéo et les menaces judiciaires qui pèsent sur l'entraînement de ses modèles. Midjourney peut-il rester le "vilain petit canard" créatif de l'IA tout en jouant dans la même cour que les GAFAM ? Vous par exemple, ce style "onirique", ça vous plaît plus que l'ultra-réalisme de Sora ?