Un robot qui manipule des objets grâce à Google
Pour optimiser les mouvements des robots, Google DeepMind a appliqué la méthode d’intelligence artificielle générative appelée Diffusion, similaire à celle utilisée par des générateurs d’images tels qu’OpenAI DALL-E. Cette approche permet aux mains robotiques d’anticiper […]
Ce que vous allez découvrir
- Google DeepMind pousse l’IA générative plus loin
- ALOHA Unleashed : la Diffusion au service de la prédiction des actions par les robots
- DemoStart : l'apprentissage par renforcement pour améliorer la dextérité des robots
- Conclusion
Un robot qui manipule des objets grâce à Google
Pour optimiser les mouvements des robots, Google DeepMind a appliqué la méthode d’intelligence artificielle générative appelée Diffusion, similaire à celle utilisée par des générateurs d’images tels qu’OpenAI DALL-E. Cette approche permet aux mains robotiques d’anticiper les actions et de renforcer considérablement leur agilité.
Google DeepMind pousse l’IA générative plus loin
Depuis 2022, plusieurs intelligences artificielles génératives ont fait leur apparition. Des chatbots comme ChatGPT produisent du texte, tandis que des outils comme DALL-E ou MidJourney génèrent des images.
Certaines IA, telles qu’OpenAI Sora ou Kling, permettent même de créer des vidéos à partir de simples instructions textuelles. Cependant, Google DeepMind a repoussé les limites en exploitant l’IA générative pour animer des robots humanoïdes.
Les ingénieurs de l’entreprise ont récemment annoncé le développement de deux nouveaux systèmes robotiques alimentés par l’IA : ALOHA Unleashed et DemoStart.
Le premier système a été conçu pour faire progresser la recherche sur la manipulation à deux bras, tandis que le second vise à perfectionner les compétences des mains robotiques équipées de plusieurs doigts, articulations ou capteurs.
ALOHA Unleashed : la Diffusion au service de la prédiction des actions par les robots
Selon l’équipe de recherche, une main robotique conçue pour saisir ou déplacer des objets fonctionne généralement de manière autonome, sans l’assistance d’une deuxième main. Le projet vise donc à exploiter l’intelligence artificielle pour apprendre à un robot à coordonner l’utilisation de ses deux mains afin d’accomplir des tâches complexes, comme lacer des chaussures.
ALOHA Unleashed rend cela possible. Ce nouveau système repose sur ALOHA 2 et la plateforme ALOHA, initialement développée par l’Université de Stanford pour des applications de téléopération.
Grâce à ce système, la dextérité des robots est grandement améliorée, permettant à leurs deux mains de se synchroniser et de « prendre conscience » l’une de l’autre lors de la résolution de tâches communes. Les démonstrations ont montré que les mains robotiques pouvaient exécuter des tâches telles que suspendre une chemise ou réparer une pièce de robot.
Les chercheurs ont ensuite intégré la technologie de diffusion, également utilisée dans les générateurs d’images comme DALL-E et Stable Diffusion, pour optimiser ces capacités.
À l’origine, ce procédé permet de générer des images à partir de bruit aléatoire. On commence avec une image complètement brouillée, composée de pixels aléatoires, sans structure identifiable.
Une IA affine progressivement cette image en réduisant le bruit étape par étape. À chaque étape, l’algorithme devine comment rendre l’image plus nette et conforme à un modèle spécifique.
Après plusieurs itérations, l’IA parvient à créer une image complète et réaliste à partir d’un point de départ chaotique.
La technique de Diffusion, utilisée par des outils comme DALL-E pour générer des images réalistes à partir de descriptions textuelles, a été adaptée par DeepMind pour permettre aux robots de prédire des actions. Cette approche permet à chaque main robotique de développer une capacité de prédiction, facilitant l’anticipation des mouvements de l’autre main.
DemoStart : l’apprentissage par renforcement pour améliorer la dextérité des robots
Les chercheurs du projet DemoStart ont souligné que pour améliorer la dextérité des robots, il sera nécessaire d’intégrer davantage de doigts, articulations et capteurs que ce qui est couramment utilisé par les mains robotiques actuelles.
Une coordination précise est également essentielle. Comme avec ALOHA Unleashed, cette coordination a été renforcée grâce à l’intégration de l’intelligence artificielle dans le processus d’apprentissage.
Dans ce cas, c’est l’apprentissage par renforcement (Reinforcement Learning) qui a été employé pour aider le robot à mieux appréhender ses capacités lorsqu’il manipule plusieurs bras, mains et doigts.
Le processus a commencé par l’attribution de tâches simples aux mains robotiques, avec une augmentation progressive de la complexité. Les chercheurs ont ainsi découvert qu’ils pouvaient apprendre à un robot à deux doigts, équipés de plusieurs articulations et capteurs, à réorienter un cube, serrer un écrou et nettoyer une zone de travail.
Si vous souhaitez en savoir plus sur ces recherches, vous pouvez consulter les détails concernant ALOHA Unleashed sur le site officiel de DeepMind, ainsi que sur GitHub.
Conclusion
Les avancées de Google DeepMind en matière d’IA générative appliquée à la robotique ouvrent des perspectives passionnantes. Ces recherches pourraient conduire à des robots plus agiles, capables d’effectuer des tâches complexes et de collaborer plus efficacement avec les humains.
C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !
Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire.
Numericoach dispose d’une offre packagée pour les licences Google Workspace, unique en France.
À bientôt !
- Articles connexes
- Plus de l'auteur