Gemini, le dernier modèle IA de Google
L’Intelligence artificielle est depuis quelque temps rentrée au cœur de nos vies. Nous sommes souvent confrontés à ces nouvelles technologies, on en parle dans les journaux télévisés, dans les articles de blog, de la part […]
Ce que vous allez découvrir
- Gemini qu’est-ce que c’est ?
-
Que présente Google avec Gemini ? - Performances de Gemini et comparatifs
- Conclusion
Gemini, le dernier modèle IA de Google
L’Intelligence artificielle est depuis quelque temps rentrée au cœur de nos vies. Nous sommes souvent confrontés à ces nouvelles technologies, on en parle dans les journaux télévisés, dans les articles de blog, de la part de certains collègues etc.
Les IA sont décrites comme révolutionnaires et effrayantes à la fois, tant certaines de leurs réponses peuvent être précises (en revanche, il reste encore beaucoup d’erreurs dans les réponses techniques ou faisant appel à des connaissances trop précises). De nombreuses entreprises se sont lancées dans ce défi technologique, c’est pourquoi Google n’a pas voulu se laisser distancer et a notamment déployé Bard son chatbot visant à concurrencer le célèbre ChatGPT.
En continuant sur cette lancée, Google a annoncé le mercredi 6 décembre son nouveau modèle d’intelligence artificielle nommé Gemini. Dans cet article, nous allons détailler les spécificités apportées par ce nouveau modèle d’IA.
Gemini qu’est-ce que c’est ?
Gemini est le nom donné par Google à son nouveau modèle de langage (LLM). C’est une intelligence artificielle multimodale, c’est-à-dire capable d’analyser, de traiter et de combiner différents types d’informations, comme le texte, le code, l’audio, l’image et la vidéo.
« Les capacités sophistiquées de raisonnement de Gemini 1.0 lui permettent d’interpréter des informations écrites et visuelles complexes, ce qui le rend singulièrement apte à isoler des connaissances difficiles à discerner dans des volumes considérables de données », Google
Google
Que présente Google avec Gemini ?
Google annonce que son nouveau modèle de langage se décline en 3 différentes tailles :
- Gemini Ultra : est la version maximale du modèle de langage. Elle se destine à des tâches de haute complexité.
- Gemini Pro : est un modèle polyvalent, conçu pour intégrer à terme tous les services de Google.
- Gemini Nano : est une version allégée de Gemini, conçue pour être utilisée localement par un smartphone.
Voici une vidéo montrant les tests de Gemini par Google :
Capable de reconnaître un dessin en temps réel, de deviner ce qui va se produire dans une image, de jouer à un jeu en répondant aux gestes de la personne ou de réagir à des situations par l’humour, voilà les capacités de Gemini montrées dans cette vidéo.
Une des forces de la démonstration en vidéo est que Gemini devine quasiment seul le contexte et répond en fonction.
Déjà disponible sur Google Bard et le Pixel 8 Pro, Gemini arrivera sur d’autres services de Google dans les prochains mois : Chrome, Search Ads ou encore Duet AI. Pour les développeurs, Google a déclaré qu’une sélection de clients et partenaires pourraient tester le modèle dans sa déclinaison Ultra dès le 13 décembre via Google AI Studio ou Google Cloud Vertex AI.
Performances de Gemini et comparatifs
Concernant les performances de Gemini, Google annonce que la version Ultra a obtenu un score de 90 % aux tests MMLU (Massive Multitask Language Understanding). Ces derniers permettent d’évaluer les modèles d’IA sur 57 thématiques différentes.
Via deux tableaux comparatifs, Google montre que son modèle fait mieux que GPT-4 d’OpenAI dans presque tous les domaines, que ce soit en interprétation de texte ou multimodale.
Conclusion
En conclusion, cette annonce de Google concernant son nouveau modèle d’intelligence artificielle, Gemini, représente une avancée majeure dans le domaine des modèles de langage multimodaux. Avec ses capacités sophistiquées de raisonnement, Gemini peut analyser et combiner différents types d’informations, allant du texte au code, en passant par l’audio, l’image et la vidéo. Les trois versions de Gemini, Ultra, Pro et Nano offrent des solutions adaptées à des tâches variées, allant de la haute complexité à une utilisation locale sur smartphone.
Les performances annoncées par Google, avec un score de 90 % aux tests MMLU pour la version Ultra, démontrent la puissance de ce nouveau modèle. Les comparatifs avec GPT-4 d’OpenAI soulignent la compétitivité de Gemini dans l’interprétation de texte et les tâches multimodales, laissant entrevoir un potentiel considérable dans divers domaines d’application.
L’intégration prévue de Gemini sur des services tels que Chrome, Search Ads, et Duet AI, ainsi que son déploiement sur Google Bard et le Pixel 8 Pro, témoignent de l’engagement de Google à mettre cette technologie à la disposition d’un large public.
En résumé, Gemini semble être une avancée significative dans le domaine de l’intelligence artificielle multimodale, offrant des performances impressionnantes et ouvrant la voie à de nombreuses applications potentielles dans notre vie quotidienne. Nous attendons néanmoins la version française et une disponibilité en France pour tester tout cela pour être certain que les promesses soient à la hauteur des annonces Marketing. On se souvient de l’annonce de DUET AI en mars 2023 et toujours pas disponible en France avant l’été 2024 au mieux.
C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !
Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire. A bientôt !
- Articles connexes
- Plus de l'auteur