Numeriblog IA Plongez dans le monde de la génération de vidéo avec Google Veo

Plongez dans le monde de la génération de vidéo avec Google Veo

La Google I/O, qui s’est tenue mardi 14 mai, s’est avérée riche en nouveautés liées à l’intelligence artificielle (IA), notamment avec l’annonce de Gemini 1.5 Pro et Flash, le Project Astra et bien d’autres encore […]

personnes ont consulté cet article

2 minutes

Rédigé par Léo Verstraet - il y a 6 mois et modifié le 31/05/2024 à 15:21

Ce que vous allez découvrir

  • Google Veo : un modèle de génération de vidéo performant
  • Quelques exemples
  • Disponibilité
  • Conclusion

Plongez dans le monde de la génération de vidéo avec Google Veo

La Google I/O, qui s’est tenue mardi 14 mai, s’est avérée riche en nouveautés liées à l’intelligence artificielle (IA), notamment avec l’annonce de Gemini 1.5 Pro et Flash, le Project Astra et bien d’autres encore ! Parmi ces différentes annonces se trouve Google Veo, l’outil de génération de vidéo par IA destiné à concurrencer directement Sora, le modèle lancé par OpenAI en février. Veo sera accessible depuis une nouvelle plateforme et intégré à certains outils de Google.

Google Veo, le modèle de génération de vidéos de Google.

Google Veo : un modèle de génération de vidéo performant

Veo génère des vidéos de haute qualité à une résolution de 1080p qui peuvent dépasser une minute, dans une grande variété de styles cinématographiques et visuels. Grâce à une compréhension avancée du langage naturel et de la sémantique visuelle, il peut générer des vidéos qui représentent fidèlement la vision créative de l’utilisateur.

Le modèle comprend également des termes cinématographiques tels que « timelapse » ou « plans aériens d’un paysage », offrant un niveau de contrôle créatif sans précédent. Il crée des séquences cohérentes et homogènes, de sorte que les personnes, les animaux et les objets se déplacent de manière réaliste tout au long des plans.

Google met en avant que Veo est le fruit de plusieurs années de développement sur divers modèles génératifs de vidéo tels que le Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet et Lumiere. Afin d’optimiser les performances de cet outil, Google exploite des modèles de diffusion latente, qui correspondent à des représentations compressées et de haute qualité des vidéos. Cette approche facilite le traitement des données, réduit le temps de génération et améliore la qualité en minimisant les incohérences.

Diagramme du fonctionnement de Google Veo.

Quelques exemples

Veo permettra de générer des vidéos à partir d’une seule image et de modifier des zones spécifiques d’une vidéo existante, par exemple en y ajoutant de nouveaux éléments. Dans l’exemple illustré ci-dessous, une image générée par intelligence artificielle a été animée à l’aide de Veo.

Image générée par intelligence artificielle.

L’entreprise à l’origine de Gemini a déjà fait un partenariat avec le cinéaste Donald Glover afin de tester le modèle. Voici une vidéo de certains extraits :

Un autre exemple d’une vidéo de 60 secondes générée par Veo :

Disponibilité

Pour l’instant Google Veo n’est disponible que pour certains créateurs dans une avant-première privée sur la plateforme VideoFX. Vous pouvez toujours essayer de vous inscrire à la file d’attente.

Image de référence

À l’avenir, Veo sera intégré à certains produits de Google, dont YouTube Shorts.

Actuellement accessible uniquement aux États-Unis, cette plateforme dispose d’un mode storyboard qui permet de créer des séquences vidéo scène par scène :

VideoFX s’ajoute à une suite déjà existante comprenant ImageFX, une interface dédiée à la génération d’images utilisant le modèle le plus récent, Imagen 3, ainsi que MusicFX, développée pour la création musicale via l’intelligence artificielle.

Conclusion

Les annonces d’IA de la part de Google se sont démultipliées avec la conférence Google I/O, l’entreprise montre qu’elle ne veut pas se laisser distancer par ses concurrents. L’annonce de Veo montre que Google veut confronter le modèle Sora d’OpenAI et rester l’un des leaders du marché.

C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !

Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire.

Numericoach dispose d’une offre packagée pour les licences Google Workspace, unique en France.

À bientôt !

Articles similaires

  • Articles connexes
  • Plus de l'auteur

Rédacteur

Photo de profil de l'auteur
Léo Verstraet

Développeur Google Apps Script

S’abonner
Notification pour
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires