Numeriblog IA Le passé révélé : comment Aeneas de Google réécrit l’histoire

Le passé révélé : comment Aeneas de Google réécrit l’histoire

Google ne cesse de repousser les limites de l’innovation, et cette fois, c’est le passé qui est à l’honneur. L’annonce récente du lancement d’Aeneas, un modèle d’intelligence artificielle révolutionnaire, marque un tournant majeur dans le […]

personnes ont consulté cet article

8 minutes

Rédigé par Thierry Vanoffe - il y a 2 mois et modifié le 01/08/2025 à 14:05

Ce que vous allez découvrir

  • Le défi des inscriptions anciennes : une quête de connexions avec Aeneas
  • Les pouvoirs d'Aeneas : un héros numérique pour le passé
  • Le moteur d'Aeneas : comment l'IA décrypte le passé
  • Des performances époustouflantes et un nouveau regard sur les débats historiques
  • La collaboration homme-IA : façonner l'avenir de la recherche historique
  • L'épigraphie à l'aube d'une nouvelle ère

Le passé révélé : comment Aeneas de Google réécrit l’histoire

Google ne cesse de repousser les limites de l’innovation, et cette fois, c’est le passé qui est à l’honneur. L’annonce récente du lancement d’Aeneas, un modèle d’intelligence artificielle révolutionnaire, marque un tournant majeur dans le domaine de l’épigraphie et de l’histoire ancienne.

Imaginez un instant : des milliers d’inscriptions latines, souvent fragmentées et énigmatiques, qui se mettent à parler grâce à la puissance de l’IA. C’est la promesse d’Aeneas, un outil conçu pour les historiens, capable de décrypter, contextualiser et même restaurer des textes anciens avec une précision et une rapidité inédites.

Le défi des inscriptions anciennes : une quête de connexions avec Aeneas

Les historiens, face à une inscription ancienne, se transforment en détectives du passé. Leur mission est de trouver des « parallèles » : des textes qui partagent des similitudes de formulation, de syntaxe, de formules standardisées, ou de provenance. Ce processus est crucial pour interpréter un fragment, lui donner un sens, et le replacer dans son contexte historique global. Mais c’est un travail colossal, chronophage, et qui exige une mémoire prodigieuse et une intuition aiguisée. Des jours, des semaines, des mois peuvent être nécessaires pour établir ces connexions, fouillant dans des bases de données spécialisées, comparant manuellement des milliers de documents.

Le lancement d’Aeneas, publié dans une étude de Nature, représente une avancée monumentale. Ce n’est pas simplement un nouvel outil, c’est une véritable révolution méthodologique. En analysant des milliers d’inscriptions latines en quelques secondes, Aeneas est capable de dénicher des parallèles textuels et contextuels qui auraient pris des années à un humain. C’est un gain de temps inestimable, permettant aux historiens de se concentrer sur l’analyse et l’interprétation des résultats, plutôt que sur la recherche exhaustive. L’IA devient ainsi un catalyseur, amplifiant les capacités humaines sans les remplacer.

Au-delà du latin : une vision multilingue de l’histoire

L’ambition d’Aeneas ne se limite pas aux inscriptions latines. Le modèle est conçu pour être adaptable à d’autres langues, d’autres écritures, et même d’autres supports. Imaginez l’impact potentiel sur l’étude des papyrus égyptiens, des inscriptions grecques, des monnaies antiques, ou des tablettes cunéiformes. En élargissant son champ d’action, Aeneas pourrait aider à établir des liens entre un éventail encore plus vaste de preuves historiques, ouvrant de nouvelles perspectives sur des civilisations entières. C’est une porte ouverte sur une compréhension plus holistique et interconnectée du passé, transcendant les barrières linguistiques et matérielles qui ont longtemps freiné la recherche.

Ce projet n’est pas l’œuvre d’une seule entité. Il est le fruit d’une collaboration fructueuse entre Google, l’Université de Nottingham, et des chercheurs des Universités de Warwick, d’Oxford et de l’Université d’économie et de commerce d’Athènes (AUEB). Cette approche collaborative souligne la complexité et l’importance du défi, reconnaissant que les avancées les plus significatives naissent souvent de la synergie entre différentes expertises. Ce partenariat illustre parfaitement comment l’IA générative peut devenir un puissant allié pour les historiens, en les aidant à identifier et interpréter les parallèles à grande échelle, une tâche quasi impossible à accomplir manuellement.

Les pouvoirs d’Aeneas : un héros numérique pour le passé

Le nom « Aeneas » n’a pas été choisi au hasard. Il fait référence au héros mythologique gréco-romain, le prince troyen Énée, qui, après la chute de Troie, a erré avant de fonder la lignée qui allait donner naissance à Rome. Tel Énée cherchant un nouveau foyer, le modèle d’IA cherche à redonner un « foyer » contextuel aux fragments textuels perdus. Il s’inscrit dans la lignée d’Ithaca, un précédent projet de Google utilisant l’IA pour restaurer, dater et situer des inscriptions grecques anciennes. Mais Aeneas va bien au-delà, offrant des capacités avancées qui transforment radicalement la façon dont les historiens interagissent avec les textes anciens.

Une panoplie de capacités révolutionnaires

Aeneas ne se contente pas de trouver des parallèles. Ses fonctionnalités avancées en font un outil polyvalent et indispensable pour la recherche historique :

  • La recherche de parallèles affinée : Cette fonctionnalité est le cœur d’Aeneas. En transformant chaque texte en une sorte d' »empreinte historique », Aeneas explore une vaste collection d’inscriptions latines et identifie des liens profonds qui peuvent aider les historiens à situer les inscriptions dans leur contexte historique plus large. C’est comme si l’IA possédait une bibliothèque mentale de tous les textes connus, capable de relier des idées, des phrases, et des concepts qui échapperaient à l’œil humain.
  • Le traitement des entrées multimodales : C’est une innovation majeure. Aeneas est le premier modèle à déterminer la provenance géographique d’un texte en utilisant non seulement le texte lui-même, mais aussi des informations visuelles, comme les images d’une inscription. L’analyse combinée du texte et de l’image permet une contextualisation plus riche et plus précise, car la forme, la calligraphie, les symboles gravés peuvent révéler des indices précieux sur l’origine d’un document.
  • La restauration de lacunes de longueur inconnue : Imaginez un texte ancien avec des trous, des sections effacées, dont on ignore la longueur exacte de ce qui manque. C’était jusqu’à présent un casse-tête pour les historiens. Aeneas est désormais capable de restaurer ces lacunes, même lorsque la longueur manquante est inconnue. Cette capacité rend l’outil incroyablement utile pour travailler sur des documents fortement endommagés, offrant une seconde vie à des textes que l’on pensait irrémédiablement perdus.
  • Des performances de pointe : Les chiffres parlent d’eux-mêmes. Aeneas établit une nouvelle référence en matière de restauration de textes endommagés et de prédiction du moment et du lieu de leur écriture. Ces performances sont le fruit d’années de recherche et de développement, témoignant de l’engagement de Google à repousser les limites de l’IA au service de la connaissance.
Les

Le moteur d’Aeneas : comment l’IA décrypte le passé

Comprendre le fonctionnement d’Aeneas, c’est comme lever le voile sur un mécanisme complexe et fascinant. Au cœur de ce système se trouve un réseau neuronal génératif multimodal, capable de traiter à la fois le texte et l’image d’une inscription. Mais pour qu’un tel modèle fonctionne, il a fallu des données, beaucoup de données.

Fonctionnement d'Aeneas

L’alimentation du savoir : le Latin Epigraphic Dataset

Pour entraîner Aeneas, les chercheurs ont assemblé un ensemble de données massif et fiable, fruit de décennies de travail d’historiens. Ces collections numériques, comme la base de données épigraphiques de Rome (EDR), la base de données épigraphiques de Heidelberg (EDH) et la base de données épigraphiques Clauss Slaby (EDCS-ELT), ont été méticuleusement nettoyées, harmonisées et liées. Le résultat ? Un ensemble de données unique, exploitable par la machine, baptisé le Latin Epigraphic Dataset (LED), comprenant plus de 176 000 inscriptions latines provenant de tout le monde romain antique. C’est cette gigantesque bibliothèque numérique qui permet à Aeneas d’apprendre, de comprendre les motifs, les nuances, et les spécificités de l’écriture latine à travers les siècles.

L’architecture du modèle : des transformateurs aux intégrations

Au niveau technique, Aeneas utilise un décodeur à transformateur pour traiter l’entrée textuelle d’une inscription. Cette architecture est particulièrement efficace pour les tâches de traitement du langage naturel, permettant au modèle de comprendre le contexte et la signification des mots. Des réseaux spécialisés gèrent la restauration et la datation des caractères à partir du texte, tandis que l’attribution géographique utilise également les images des inscriptions en entrée.

Le décodeur récupère ensuite les inscriptions similaires à partir de la LED, classées par pertinence. Pour chaque inscription, le mécanisme de contextualisation d’Aeneas utilise une technique appelée « intégrations » (embeddings). Ces intégrations encodent les informations textuelles et contextuelles de chaque inscription dans une sorte d' »empreinte digitale historique ». Cette empreinte contient des détails sur le contenu du texte, sa langue, sa période et son lieu d’origine, et surtout, la façon dont il se rapporte à d’autres inscriptions. C’est cette capacité à créer et à comparer ces empreintes qui permet à Aeneas d’identifier des liens profonds et souvent insoupçonnés entre des textes apparemment disparates.

Des performances époustouflantes et un nouveau regard sur les débats historiques

Les capacités d’Aeneas ne sont pas seulement impressionnantes sur le papier ; elles se traduisent par des performances concrètes qui redéfinissent les standards de la recherche épigraphique.

Précision et clairvoyance

Aeneas parvient à regrouper les inscriptions par date d’écriture avec une clarté bien supérieure à celle des autres modèles à usage général formés sur le latin. Cela signifie qu’il est capable de discerner des nuances chronologiques subtiles que les méthodes traditionnelles peinent à identifier.

En ce qui concerne la restauration, Aeneas est d’une efficacité remarquable :

  • Il restaure les inscriptions endommagées avec une précision de 73% (Top 20) pour les espaces vides allant jusqu’à dix caractères.
  • Ce taux ne chute qu’à 58% lorsque la durée de la restauration est inconnue, une tâche d’une complexité extrême.

Plus important encore, le modèle ne se contente pas de donner des résultats ; il présente son raisonnement de manière interprétable, fournissant des cartes de saillance qui mettent en évidence les parties des données saisies qui ont influencé ses prédictions. Cette transparence est cruciale pour les historiens, leur permettant de comprendre et de valider les conclusions de l’IA.

Grâce à l’utilisation de données visuelles, Aeneas peut attribuer une inscription à l’une des 62 provinces romaines antiques avec une précision de 72%. Pour la datation, le modèle est capable de situer un texte dans les 13 années suivant les intervalles de dates fournis par les historiens. C’est une précision stupéfiante, qui ouvre de nouvelles avenues pour la chronologie des événements antiques.

Image de référence

L’affaire des Res Gestae Divi Augusti : L’IA au service de la controverse

Pour tester l’impact d’Aeneas sur des débats historiques concrets, les chercheurs lui ont soumis l’une des inscriptions romaines les plus célèbres : les Res Gestae Divi Augusti, le récit à la première personne des réalisations de l’empereur Auguste. La datation de cette inscription a longtemps été un sujet de controverse parmi les historiens.

Plutôt que de prédire une date unique, Aeneas a généré une distribution détaillée des dates possibles, révélant deux pics distincts :

  • Un pic plus faible vers 10-1 av. J.-C.
  • Un pic plus important et plus fiable entre 10-20 apr. J.-C.

Ces résultats ont non seulement permis de quantifier les deux hypothèses de datation dominantes, mais ils ont aussi montré comment Aeneas fondait ses prédictions sur des caractéristiques linguistiques subtiles et des marqueurs historiques tels que les titres officiels et les monuments mentionnés dans le texte. En transformant la datation en une estimation probabiliste basée sur des données linguistiques et contextuelles, le modèle offre une nouvelle approche quantitative pour aborder des débats historiques anciens, souvent dominés par l’interprétation qualitative.

De manière fascinante, Aeneas a également retrouvé de nombreux parallèles pertinents dans les textes juridiques impériaux liés à l’héritage d’Auguste. Cela a permis de souligner comment l’idéologie de l’empire romain était reproduite et diffusée à travers différents médias et régions géographiques. C’est une démonstration éclatante de la capacité d’Aeneas à révéler des liens macro-historiques qui échapperaient à une analyse fragmentée.

La collaboration homme-IA : façonner l’avenir de la recherche historique

L’intégration d’Aeneas dans les pratiques de recherche existantes des historiens est au cœur de sa conception. L’outil n’est pas là pour remplacer l’expertise humaine, mais pour la compléter et l’augmenter.

L’étude collaborative : une preuve par l’exemple

Pour évaluer l’impact réel d’Aeneas, une étude collaborative à grande échelle a été menée. Vingt-trois historiens, travaillant régulièrement avec des inscriptions, ont été invités à restaurer, dater et situer un ensemble de textes en utilisant Aeneas. Les résultats ont été sans appel : les approches les plus efficaces ont été obtenues lorsque les historiens ont combiné leurs connaissances avec les informations contextuelles et les prédictions d’Aeneas.

Cette collaboration a permis aux historiens :

  • D’identifier de nouveaux parallèles qu’ils n’auraient pas trouvés seuls.
  • De renforcer leur confiance dans la réalisation de tâches épigraphiques complexes.
  • De constater une accélération significative de leurs travaux.
  • D’élargir la gamme des inscriptions parallèles les plus pertinentes qu’ils pouvaient analyser.

C’est une validation retentissante du modèle collaboratif : l’IA apporte la puissance de calcul et la capacité à traiter d’énormes quantités de données, tandis que l’historien apporte son jugement critique, son intuition, et sa capacité à interpréter les nuances culturelles et historiques.

Partager les outils, ouvrir les possibilités

Aeneas est conçu pour être un outil de recherche accessible. En combinant les connaissances d’experts et l’apprentissage automatique, il ouvre un processus collaboratif, offrant des suggestions interprétables qui constituent de précieux points de départ pour la recherche historique. Il ne dicte pas des réponses, mais propose des pistes, des hypothèses étayées par des données, invitant l’historien à explorer et à valider.

Dans le cadre de son lancement, Google met à niveau Ithaca, son modèle grec ancien, pour qu’il soit désormais alimenté par Aeneas. Cela inclut la fonction de contextualisation, les restaurations de longueur inconnue, et des performances globales améliorées. C’est une démarche logique qui unifie les efforts et étend les bénéfices de cette technologie à un champ linguistique plus large.

L’épigraphie à l’aube d’une nouvelle ère

L’arrivée d’Aeneas n’est pas seulement une prouesse technologique ; c’est un événement qui redéfinit le rôle de l’intelligence artificielle dans les sciences humaines. Longtemps considérées comme des domaines où l’intuition et l’érudition humaines sont irremplaçables, l’épigraphie et l’histoire ancienne démontrent aujourd’hui comment l’IA peut devenir un partenaire essentiel. En automatisant les tâches répétitives et chronophages, en révélant des patterns et des connexions invisibles à l’œil nu, Aeneas libère le temps et l’énergie des historiens, leur permettant de se concentrer sur l’interprétation, la synthèse, et la construction de récits plus riches et plus nuancés du passé.

Ce modèle d’IA n’est pas un substitut à la pensée humaine, mais un formidable amplificateur de nos capacités cognitives. Il nous rappelle que l’innovation est un voyage continu, où les frontières entre les disciplines s’estompent pour donner naissance à des avancées insoupçonnées. L’histoire n’est plus seulement une affaire de poussière et de parchemins ; elle s’écrit aussi en algorithmes, en données, et en intelligence artificielle. Et grâce à Aeneas, le passé, autrefois silencieux et fragmenté, se met à nous parler avec une clarté et une richesse inédites, nous offrant une compréhension plus profonde de ce qui nous a précédés.


C’est la fin de cet article ! Si vous souhaitez avoir plus d’informations sur les outils Google et sur l’IA, restez connectés pour en savoir plus !

Si vous souhaitez développer un projet avec notre équipe de développeurs de choc, contactez-nous via ce formulaire

Numericoach dispose d’une offre packagée pour les licences Google Workspace, unique en France.

À bientôt !

Articles similaires

  • Articles connexes
  • Plus de l'auteur

Rédacteur

Photo de profil de l'auteur
Thierry Vanoffe

Thierry VANOFFE, consultant, formateur, coach Google Workspace CEO de Numericoach, leader de la formation Google Workspace en France. Passionné par Google, ce blog me permet de partager cette passion et distiller tutos, trucs, astuces, guides sur les outils Google. N'hésitez pas à me solliciter pour vos projets de formation.

S’abonner
Notification pour
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires