Numeriblog IA Gemini Flash, le nouveau modèle d’intelligence artificielle de Google

Gemini Flash, le nouveau modèle d’intelligence artificielle de Google

Parallèlement au lancement du nouveau modèle Gemini 1.5 Pro, Google a également présenté un nouveau modèle appelé Gemini 1.5 Flash lors de l’événement Google I/O 2024. Il s’agit d’un modèle léger conçu pour la vitesse […]

personnes ont consulté cet article

3 minutes

Rédigé par Léo Verstraet - il y a 3 semaines

Ce que vous allez découvrir

  • Qu’est-ce que Gemini Flash ?
  • Comparaison avec Gemini 1.5 Pro
  • Prix et disponibilité
  • Conclusion

Gemini Flash, le nouveau modèle d’intelligence artificielle de Google

Parallèlement au lancement du nouveau modèle Gemini 1.5 Pro, Google a également présenté un nouveau modèle appelé Gemini 1.5 Flash lors de l’événement Google I/O 2024. Il s’agit d’un modèle léger conçu pour la vitesse et l’efficacité.

Gemini 1.5 Flash

Qu’est-ce que Gemini Flash ?

Gemini Flash est le nouveau modèle de l’IA vedette de Google : Gemini. Ce modèle plus petit est optimisé pour les tâches plus étroites ou à haute fréquence où la rapidité du temps de réponse du modèle est la plus importante.

C’est donc le modèle le plus rapide fourni par l’API dans l’API. Bien qu’il soit plus léger que le modèle 1.5 Pro, il est capable de raisonner de manière multimodale sur de grandes quantités d’informations et offre une qualité impressionnante pour sa taille.

Un autre énorme avantage est que Gemini 1.5 Flash suit le modèle Pro, puisqu’il possède aussi 1 000 000 de jetons.

D’après Demis Hassabis, le PDG de Google DeepMind, Gemini 1.5 Flash excelle en matière de résumés, d’applications de chat, de sous-titrage d’images et de vidéos, d’extraction de données à partir de longs documents et tableaux, etc. Cela s’explique par le fait qu’il a été entraîné par Gemini 1.5 Pro grâce à un processus appelé « distillation », au cours duquel les connaissances et les compétences les plus essentielles d’un modèle plus grand sont transférées à un modèle plus petit et plus efficace.

Comparaison avec Gemini 1.5 Pro

Comme on peut le voir dans le tableau ci-dessous, Gemini 1.5 Flash est légèrement moins performant que Gemini 1.5 Pro dans l’ensemble à l’exception de l’audio où Gemini Flash surpasse Gemini Pro. Le modèle est donc très performant en plus d’offrir un temps de réponse plus rapide.

Comparaison entre Gemini 1.5 Flash et Gemini 1.5 Pro.

Prix et disponibilité

Pour utiliser l’API de Gemini 1.5 Flash, il existe une solution sans frais, proposant 15 requêtes par minute, 1 million de jetons par minute et un total de 1500 requêtes par jour. Il est important de noter que dans la version gratuite, les requêtes et les réponses de Gemini seront collectées par Google pour améliorer leurs produits.

Il existe également une solution payante, offrant 360 requêtes par minute, 10 millions de jetons par minute et 10 000 requêtes par jour. Le prix d’entrée est de 0,35$ pour 1 million de jetons pour les requêtes comportant jusqu’à 128 000 jetons ou de 0,70$ pour 1 million de jetons pour les requêtes comportant plus de 128 000 jetons.

Le prix de sortie, quant à lui, est de 1,05 $ pour 1 million de jetons pour les requêtes comportant jusqu’à 128 000 jetons, ou de 2,10 $ pour 1 million de jetons pour les requêtes comportant plus de 128 000 jetons.

À noter que cette version ne collecte pas les données des requêtes et des réponses et que la facturation débutera le 30 mai 2024.

Qu’est-ce qu’un jeton ?

En IA, les jetons peuvent être considérés comme des morceaux de mots. Avant que l’API ne traite les instructions, l’entrée est décomposée en jetons. Ces jetons ne sont pas coupés exactement là où les mots commencent ou se terminent – ils peuvent inclure des espaces de fin et même des sous-mots. Lorsqu’un texte est « tokenisé », cela signifie qu’il est divisé en jetons individuels.

Voici quelques règles pratiques pour comprendre les jetons en termes de longueur :

1 jeton ≈ 4 caractères en anglais

1 jeton ≈ ¾ mots

100 jetons ≈ 75 mots

Ou

1-2 phrases ≈ 30 jetons

1 paragraphe ≈ 100 jetons

1 500 mots ≈ 2048 jetons

Ces données sont à prendre avec précaution, car d’un modèle à l’autre, le système de jetons peut évoluer. Le même texte peut générer plus ou moins de jetons selon qu’il est utilisé avec une ancienne ou une nouvelle version d’une IA.

Qu’est-ce qu’un prix d’entrée et de sortie ?

Prix d’Entrée :

0,35 $ / 1 million de jetons (pour les requêtes comportant jusqu’à 128 000 jetons)

Cela signifie que pour chaque million de jetons d’entrée (texte que vous envoyez au modèle pour traitement), vous payez 0,35 $ si la requête contient jusqu’à 128 000 jetons.

0,70 $ / 1 million de jetons (pour les requêtes de plus de 128 000 jetons)

Si la requête dépasse 128 000 jetons, le coût par million de jetons d’entrée augmente à 0,70 $.

Prix de Sortie :

1,05 $ / 1 million de jetons (pour les requêtes comportant jusqu’à 128 000 jetons)

Pour chaque million de jetons générés en sortie par le modèle (réponse du modèle), vous payez 1,05 $ si la requête initiale contenait jusqu’à 128 000 jetons.

2,10 $ / 1 million de jetons (pour les requêtes de plus de 128 000 jetons)

Si la requête initiale dépasse 128 000 jetons, le coût par million de jetons en sortie augmente à 2,10 $.

Conversion en euro

0,35$ = 0,32€

0,70$ = 0,65€

1,05$ = 0,97€

2,10$ = 1,94€

Conclusion

C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !

Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire.

Numericoach dispose d’une offre packagée pour les licences Google Workspace, unique en France.

À bientôt !

Articles similaires

  • Articles connexes
  • Plus de l'auteur

Rédacteur

Photo de profil de l'auteur
Léo Verstraet

Développeur Google Apps Script

S’abonner
Notification pour
0 Commentaires
Commentaires en ligne
Afficher tous les commentaires