Module
Artificial intelligence and large language model
Enseignement dispensé en anglais
L’intelligence artificielle (IA) et en particulier les grands modèles de langage (LLM) transforment les pratiques de recherche : par exemple, extraction automatisée d’informations, nettoyage des données, aide à la revue systématique, analyse thématique en recherche qualitative, ou encore aide à l’analyse d’algorithmes.
Ce cours permettra aux chercheurs/chercheuses et aux professionnel·les de la recherche clinique, de l’épidémiologie et de la santé publique d’acquérir les bases conceptuelles nécessaires pour comprendre le fonctionnement des systèmes d’IA, évaluer leur fiabilité et appréhender la manière dont ils pourraient transformer les pratiques de recherche.
Les participant·es acquerront des bases solides sur les concepts clés et la terminologie, ainsi que sur les considérations éthiques et réglementaires liées à l’IA. Les défis pratiques associés aux données réelles et aux contraintes décisionnelles seront également examinés. Le cours présente une gamme de méthodes basées sur l’IA et fournit aux participant·es des approches pratiques pour identifier les outils les plus appropriés à leurs objectifs de recherche.
Le cours couvre quatre domaines clés :
- Concepts clés de l’IA : ce que l’IA peut et ne peut pas faire, familles de modèles, évaluation des modèles, biais, incertitude et questions réglementaires (RGPD, loi européenne sur l’IA).
- Données et méthodes : caractéristiques des données de santé publique, défis liés à la qualité des données, exemples d’outils et comment les choisir.
- Techniques LLM modernes : fonctionnement des LLM, stratégies d’invite, génération augmentée par récupération (RAG) et agents.
- Cas d’utilisation appliqués : diagnostic, aide à la revue systématique, extraction d’informations, etc.
Pré-requis : Aucune connaissance en codage ou en mathématiques n’est requise. Le cours met l’accent sur la clarté conceptuelle et la compréhension pratique.
Une connaissance de base de Python ou d’un langage de programmation est utile, mais n’est pas obligatoire.
Informations pratiques
Enseignements
Dates
Tarifs
Programme
Jour 1
Session du matin :
- Comprendre l’IA : concepts et vocabulaire
- Évaluer et faire confiance à un système d’IA
Session de l’après–midi :
- Éthique, réglementation et gouvernance dans le domaine de l’IA
- Cours intensif sur Collab et Python
Jour 2
Session du matin :
- Sources et format des données
- Méthodes de traitement des données
Session de l’après–midi :
- Exemples d’outils
- Quelles méthodes pour quelle utilisation ?
Jour 3
Session du matin :
- Comprendre les LLM
- Génération à enrichissement contextuel (RAG, Retrieval-Augmented Generation) 1/2
Session de l’après–midi :
- Génération à enrichissement contextuel (RAG) 2/2
- Agents
Jour 4
Session du matin :
- Quelques cas d’utilisation réels
Session de l’après–midi :
- Mise en pratique
- Questions
Intervenant·es

Mélissa Duran
Mélissa Duran est médecin généraliste et doctorante en épidémiologie clinique. Elle est animée par une passion profonde pour les soins primaires, la pensée critique et la médecine factuelle. Forte de sa formation médicale et d’un master en recherche comparative sur l’efficacité, elle a rejoint l’équipe METHODS du CRESS-UMR1153 afin d’approfondir son expertise. Elle prépare actuellement un doctorat en épidémiologie clinique (sous la direction du Pr Boutron et du Pr Sidorkiewicz). Ses travaux portent à la fois sur l’utilisation de l’IA en médecine générale et sur l’utilisation de l’IA en épidémiologie clinique.

Alex Fernandes
Alex Fernandes est doctorant à l’Université Paris Cité et moniteur à l’École Normale Supérieure – PSL. Ses recherches portent sur l’utilisation de l’apprentissage statistique pour l’inférence causale. Il a d’abord obtenu un diplôme en mathématiques, puis a complété sa formation en étudiant la biologie et les affaires publiques. Il a travaillé sur des algorithmes pour l’analyse topologique des données et l’effet des traitements individualisés, et a participé à l’élaboration de plusieurs outils, notamment dans le domaine du deep learning. Sa thèse vise à développer un cadre permettant de faire le lien entre les essais contrôlés randomisés et la population réelle à l’aide de données issues de registres, comme l’exige l’évaluation des technologies de la santé.

François Petit
François Petit est directeur de recherche à l’Inserm. Titulaire d’un doctorat en mathématiques pures, avec une spécialisation en géométrie algébrique, il a d’abord travaillé dans les domaines de la géométrie algébrique et de la physique mathématique. Ses travaux ont ensuite évolué vers le développement de méthodes d’analyse de données basées sur des techniques de topologie algébrique. En 2019, il a obtenu une chaire d’excellence de l’Université Paris Cité. Ses recherches actuelles portent sur le développement de méthodes mathématiques, statistiques et d’apprentissage automatique pour la médecine personnalisée, avec un accent particulier sur l’inférence causale et l’analyse topologique des données appliquées aux données biomédicales complexes.

Thomas Starck
Thomas Starck est chargé d’enseignement et de recherche. Sa thèse de doctorat portait sur l’application des méthodes d’analyse de données aux questions environnementales. Il s’est ensuite orienté vers la méta-recherche et a rejoint l’équipe METHODS du CRESS, où il étudie l’évolution de la certitude des preuves relatives aux interventions médicales et développe des interventions visant à renforcer l’écosystème de la recherche primaire. Son travail porte également sur l’automatisation des processus de synthèse des preuves. Parallèlement, il enseigne les statistiques et l’épidémiologie à des étudiant·es en médecine et en master.

