Arnaud Demortière, CNRS : « Explication de texte pas si artificielle »
Passant de l’étonnement à la retenu, Arnaud Demortière, chercheur au CNRS, partage son expérience avec l’outil d’Intelligence Artificielle Chat GPT.
Dans le roman de Douglas Adams, Le Guide du voyageur galactique, le super-ordinateur extraterrestre « Deep Thought » donne, après 7,5 millions d’années de réflexion, une réponse absurde et énigmatique à la grande question sur la vie, l’univers et le reste. La réponse, « 42 », marqua profondément toute une génération, symbolisant les limites de l’intelligence, même artificielle, à expliquer de manière satisfaisante le sens de l’existence.
Vu l’engouement de ces dernières semaines pour ChatGPT, l’agent conversationnel de l’entreprise OpenAI, je me devais à mon tour de le tester avec la même grande question : « Quel est le sens de l’existence ? ». Voici sa réponse : « Certains peuvent trouver le sens de l’existence dans la famille, la carrière, l’art, la musique, la science ou la religion, tandis que d’autres peuvent le trouver dans l’amour, la compassion, la justice ou la liberté.
En fin de compte, le sens de l’existence est une question personnelle et subjective qui doit être explorée et découverte par chacun de nous au cours de notre vie. » Bluffant, n’est-ce pas ?
Au cœur de la machine
On peut comprendre pourquoi ChatGPT a atteint 1 million d’utilisateur·rices par jour, ce qui est un record absolu, en comparaison de Facebook, qui a mis 10 mois à atteindre ce chiffre.
ChatGPT est avant tout un grand modèle de langage naturel (LLM), à l’instar de Bloom (Hugging Face), construit sur le modèle GPT-3.5 (Generative Pre-trained Transformer) qui a été entraîné sur 175 milliards de paramètres. Les données d’entrée de ce modèle ont impliqué l’utilisation d’une base de données gigantesque de documents, provenant du web appelée « Common Crawl » et surtout, l’utilisation de la bibliothèque d’articles Wikipédia, donnant de la richesse et de l’exactitude aux contenus proposés. GPT-3.5 se décline en une série de modèles permettant une multitude d’actions : la traduction, la classification sémantique, l’analyse de texte et la réalisation de résumés.
Avec le modèle Codex, il est également capable de comprendre et de générer du code informatique, outil précieux pour les développeur·ses les plus aguerri·es. Malgré ce haut degré de compétence de ChatGPT, je n’arrive pas à obtenir systématiquement des réponses pertinentes, aussi bien sur le code que l’analyse de texte. Il me faut reformuler la requête encore et encore.
Pour contourner ce problème, on voit apparaître les « Prompt Engineer », un métier émergent qui consiste à interagir de manière optimale avec les modèles d’IA génératifs pour obtenir les réponses les plus pertinentes possible. Les « Prompts » doivent comprendre les limites des modèles et inventer des stratégies afin de générer des réponses d’une grande complexité.Il reste quand même une question qui me travaille depuis que j’ai commencé à utiliser ChatGPT. En tant que scientifique, j’ai le réflexe et même l’obligation de citer mes sources dans toutes mes publications.
Mais comment peut-on vérifier les sources des informations obtenues par ChatGPT ? Et surtout peut-on effectuer une recherche inverse permettant de remonter le fil de la connaissance ? La vérification et les liens que l’on tisse entre les sources sont essentiels dans le processus de recherche et dans notre manière de construire la connaissance. ChatGPT actuellement ne permet pas ce processus.
Ça vous plaira aussi
- Tribune du club
Le numérique au service de la redirection ?
- Portfolio
La créativité à l’épreuve de l’IA
- Témoignages
Génération Dorothée, 30 ans après