Numeriblog IA ChatGPT et DALL-E : OpenAI met les bouchées doubles

ChatGPT et DALL-E : OpenAI met les bouchées doubles

L’intelligence artificielle (IA) générative continue de repousser les limites de l’innovation, un nom en particulier ressort souvent : ChatGPT dont le lancement a été effectué le 30 novembre 2022. Il se trouve actuellement en concurrence […]

5(1)
personnes ont consulté cet article

4 minutes

Rédigé par Léo Verstraet - il y a 6 mois

Ce que vous allez découvrir

  • ChatGPT peut maintenant voir, entendre, parler et même consulter le web
  • DALL-E 3 intégré à ChatGPT
  • Conclusion

ChatGPT et DALL-E : OpenAI met les bouchées doubles

Logo Open AI

L’intelligence artificielle (IA) générative continue de repousser les limites de l’innovation, un nom en particulier ressort souvent : ChatGPT dont le lancement a été effectué le 30 novembre 2022. Il se trouve actuellement en concurrence avec d’autres IA de ce style comme Bard, le chatbot créé par Google, ou encore Claude 2 de la société Anthropic. 

Le nom de DALL-E quant à lui a beaucoup fait parler à son lancement le 5 janvier 2021 de part son côté novateur dans le domaine. Seulement, il a vite été concurrencé par l’apparition de  nouveaux modèles d’IA pour la génération d’images comme Midjourney (leader dans ce domaine actuellement), Stable Diffusion ou encore Jasper Art.

Ces deux créations phares d’OpenAI (une société américaine spécialisée dans le domaine de l’intelligence artificielle) ont été dotées de nouvelles fonctionnalités afin de concurrencer leur secteur respectifs (Les chatbots pour ChatGPT et les IA de génération d’images pour DALL-E). Découvrons ensemble ces nouveautés.

ChatGPT peut maintenant voir, entendre, parler et même consulter le web

Logo de l'IA générative ChatGPT

Un assistant vocal intégré à l’application

En effet ChatGPT, bien qu’il soit toujours très utilisé, se doit d’être amélioré. OpenAI l’a bien compris et a apporté des améliorations de taille à son chatbot.

Dans un article de blog publié ce lundi 25 septembre 2023, OpenAI annonce l’implémentation de “nouvelles capacités vocales et visuelles” pour ChatGPT.

Il sera donc bientôt possible de discuter à l’oral avec ChatGPT grâce à la fonctionnalité “Voice”. 

“Vous pouvez désormais utiliser Voice pour engager une conversation avec votre assistant. Parlez-lui en déplacement, demandez-lui une histoire pour votre famille ou réglez un débat à table.” écrit OpenAI dans son article.

Source : X (anciennement Twitter)

ChatGPT pourra non seulement vous écouter parler mais vous répondre avec une des cinq voix prédéfinies que vous pourrez changer comme bon vous semble.

Pour mettre en place la fonctionnalité, il faudra aller dans “Settings” → “New Features” sur votre application mobile et cocher l’option “Voice Conversations”.

Une fois cela fait, il vous suffira de cliquer sur l’icône en forme de casque situé dans le coin supérieur droit de l’écran pour choisir une des cinq voix misent à disposition.

Cette fonctionnalité n’est disponible pour le moment que pour les utilisateurs abonnés à ChatGPT Plus ou Enterprise.

L’analyse d’image par ChatGPT

L’autre nouveauté apportée à ChatGPT est l’analyse ou le commentaire d’image. En effet sur l’application, vous pourrez prendre des photos ou les sélectionner depuis votre galerie et associer un prompt à cette image afin d’obtenir une réponse du chatbot.

Source : X (anciennement Twitter)

Comme expliqué dans la vidéo ci-dessus, vous pourrez ajouter des requêtes afin d’affiner la réponse ou même mettre en évidence un élément de l’image grâce à l’outil “Dessin”.

Pour utiliser cette fonctionnalité, vous devrez appuyer sur le bouton en forme de “+” sur la gauche de l’endroit où vous saisissez votre prompt (demande en français) et appuyer soit sur l’icône en forme d’appareil photo pour prendre une photo, soit sur l’icône en forme d’image pour en sélectionner une depuis votre galerie.

Cette fonctionnalité n’est disponible pour le moment que pour les utilisateurs abonnés à ChatGPT Plus ou Enterprise.

ChatGPT connecté à internet

Jusqu’à maintenant, la base de connaissance de ChatGPT s’arrêtait en septembre. Grâce à la fonctionnalité “Browse with Bing”, ChatGPT peut récupérer les données en temps réel.

Cette fonctionnalité n’est disponible que pour les abonnées Plus et Enterprise pour le moment mais OpenAI précise qu’à termes, elle sera disponible à tous les utilisateurs.
Lors du lancement de l’abonnement ChatGPT Plus, l’accès aux données internet avait déjà été mis en place pour le chatbot seulement suite à un bug cette fonctionnalité avait été retirée.

DALL-E 3 intégré à ChatGPT

Logo DALL-E 3

La grande nouveauté apportée à DALL-E 3 est que ce dernier sera intégré à ChatGPT.

Vous pourrez donc demander au chatbot de vous générer des images et il sera en mesure de les ajuster selon vos prompts. DALL-E 3 sera disponible dans ChatGPT au début du mois d’Octobre pour tous les abonnés à ChatGPT Plus et Enterprise.

De plus DALL-E 3 devrait être plus performant au niveau des résultats que ses versions précédentes

“DALL-E 3 comprend beaucoup plus de nuances et de détails que nos systèmes précédents, ce qui vous permet de traduire facilement vos idées en images exceptionnellement précises.”

OpenAI (blog officiel).

Voici une vidéo de présentation posté sur le compte Twitter de Sam Altman CEO de OpenAI : 

Source : X (anciennement Twitter)

Des limites soumises à DALL-E 3

En effet OpenAI explique dans la présentation de DALL-E 3 que des limites ont été imposées à DALL-E 3 pour éviter les images choquantes notamment.

“Comme pour les versions précédentes, nous avons pris des mesures pour limiter la capacité de DALL-E 3 à générer des contenus violents, pour adultes ou haineux.”

“DALL-E 3 dispose de mesures d’atténuation pour refuser les requêtes qui demandent le nom d’un personnage public. Nous avons amélioré les performances en matière de sécurité dans des domaines à risque tels que la génération de personnages publics […] afin d’éclairer notre évaluation des risques et nos efforts d’atténuation dans des domaines tels que la propagande et la désinformation.”

OpenAI

Les droits d’auteur et la génération d’images

Comme pour sa version antérieure, les images que vous générez avec DALL-E 3 vous appartiennent, et vous pouvez les utiliser pour les commercialiser sans autorisation à demander au préalable.

De plus, DALL-E 3 a été créé pour refuser toute demande de création d’image dans le style d’un artiste vivant

“DALL-E 3 est conçu pour refuser les demandes d’images dans le style d’un artiste vivant. Les créateurs peuvent désormais exclure leurs images de la formation de nos futurs modèles de génération d’images.”

OpenAI

Conclusion

Les nouveautés présentées par OpenAI pour ses deux produits ChatGPT et DALL-E ont pour but de continuer à concurrencer le secteur des intelligences artificielles. Surtout pour DALL-E 3 qui pourrait prendre la place de leader du secteur des IA génératrices d’images si la génération est aussi précise et nuancée que ce qui est décrit par l’entreprise.

DALL-E 3 pourrait nous permettre de créer des thèmes Slides ou même Forms, créer des images adaptées pour des couvertures de livres, ou même pour donner des inspirations de design de personnages fictifs.

Quant à ChatGPT, ces nouveautés permettent de nous aider encore un peu plus, en nous facilitant le moyen de lui expliquer nos soucis, de lui poser des questions sur certains sujets et d’obtenir des réponses différentes de ce que l’on aurait pu imaginer seuls.

Le sujet des intelligences artificielles divise, certains seront contents, impressionnés, intéressés par ces nouveautés, d’autres en auront peur et les fuiront comme la peste.

Alors, il semble bon de rappeler que ces IA sont des outils permettant de faciliter certaines tâches et processus mais sont encore très loin d’atteindre toutes les capacités dont l’être humain est doté.

C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !

Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire. A bientôt !

Articles similaires

  • Articles connexes
  • Plus de l'auteur

Rédacteur

Photo de profil de l'auteur
Léo Verstraet

Développeur Google Apps Script

S’abonner
Notification pour

5

Note du cours

(1)

(0)

(0)

(0)

(0)

1 Commentaire
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Donna Tum
Votre note :
     

Comme toute utilisation d’IA dans Team-GPT, l’intégration de Dall-E fonctionne via l’API. Dall-E 3 est actuellement le seul modèle Dall-E accessible dans Chat GPT Gratuit. Par conséquent, si votre espace de travail utilise un modèle différent, tel qu’Azure, Claude, ou un modèle open source via Anyscale, vous devrez également lier votre clé API OpenAI.