Module

Introduction aux approches statistiques pour l’analyse de données longitudinales

Enseignement dispensé en français

Pr Porcher et Pr Tran enseignant le module devant la classe

Modules

Introduction aux approches statistiques pour l’analyse de données longitudinales

Enseignement dispensé en français

module intelligence artificielle

Ce cours vise à présenter plusieurs méthodes statistiques pour analyser des données longitudinales, afin d’aider les participants à sélectionner l’approche la plus adaptée à leurs questions de recherche. Après une introduction aux différents types de données longitudinales, la première partie se concentrera sur l’analyse du risque de survenue d’un événement (analyse de survie), en intégrant l’utilisation de l’âge en échelle de temps, les données dépendantes du temps, le risque compétitif de décès et en introduisant les modèles multi-états. La seconde partie explorera l’analyse des données répétées dans le temps, avec pour objectif de modéliser des trajectoires dans différents groupes et de les comparer. Les modèles mixtes linéaires et logistiques seront présentés avec une attention particulière à la modélisation de l’effet du temps. Une présentation conceptuelle de l’analyse de profils de trajectoires sera également faite. Chaque section inclura une introduction aux modèles statistiques concernés, accompagnée d’exemples concrets. Ces exemples couvriront à la fois la mise en œuvre des analyses en R et l’interprétation des coefficients obtenus.

Prérequis nécessaires : connaissances de bases en statistiques, bonne pratique des modèles de régression usuels (linéaire et logistique) et en management de données, connaissance du logiciel R.

Logiciel à installer au préalable : R

Informations pratiques

Enseignements

  • 12h de cours

  • Formation par des experts du domaine

  • Enseignement destiné aux doctorant-es, jeunes chercheurs-ses, clinicien-es, adminitrateur-trices

Dates

  • 11 et 12 juin 2025 (dates à confirmer)

Tarifs

  • Étudiant.e.s : 408 €

  • Établissements publics : 714 €

  • Établissements privés : 918€

Programme

Jour 1

  • Introduction sur les différents types de données longitudinales
    Aline Dugravot
  • Méthodes d’analyse du risque de survenue d’un évènement (analyse de survie) :  Courbe de Kaplan-Meier, Modèle de Cox (utilisation de différentes échelles de temps), variables dépendantes du temps, risque compétitif et modèle Multi-Etats.
    Aurore Fayosse
  • Application dans R
    Aurore Fayosse

Jour 2

  • Méthodes d’analyse des données répétées dans le temps (modélisation de l’évolution) : Modélisation de l’effet du temps (utilisation de différentes échelles de temps) ; Prise en compte de la corrélation entre les observations (Modèles mixtes linéaire et logistique) ; Identification de profil de trajectoire (sous-groupes partageant des trajectoires similaires).
    Aline Dugravot
  • Application dans R
    Aline Dugravot, Gabriella Silva

Intervenantes

Aline Dugravot
Aline Dugravot

Aline Dugravot est biostatisticienne et cheffe de projet scientifique. Elle a suivi une formation de biostatisticienne et a rejoint l’équipe EpiAgeing (CRESS UMR 1153) en 2006, avant d’obtenir un poste permanent en 2014. Son expertise porte sur l’analyse de données longitudinales, avec une expérience dans l’utilisation de modèles mixtes, de modèles multi-états, et d’analyses prenant en compte les données manquantes et l’attrition.

Son rôle dans l’équipe EpiAgeing consiste à contribuer aux aspects méthodologiques des recherches entreprises dans l’équipe, et à guider le plan d’analyses statistiques des étudiants de master et de doctorat. Elle gère également la mise en place de la nouvelle cohorte CIRCAME  sur 1500 patients vus dans les centres de mémoire des hôpitaux parisiens pour étudier le rôle du rythme circadien sur la démence.

Aurore Fayosse
Aurore Fayosse

Aurore Fayosse est biostatisticienne et gestionnaire de grandes bases de données. Elle est ingénieure statisticienne et a rejoint l’équipe EpiAgeing (CRESS UMR 1153) en 2015.  Son expertise porte sur les méta-analyses, les modèles de prédiction des risques et les analyses de données longitudinales.

Au sein de son équipe de recherche, elle a deux rôles. Le premier est d’entreprendre des analyses statistiques sur divers projets et de guider le plan d’analyses statistiques des étudiants de master et de doctorat. Le second est la responsabilité de la gestion des données longitudinales de cohorte. Cela implique la supervision complète du cycle de vie des données, souvent complexes et volumineuses, et la construction de variables dérivées et l’harmonisation des données pour les analyses groupées.

Gabriella Silva
Gabriella Silva

Gabriella Silva est biostatisticienne et chercheuse post-doctorale.

Après avoir obtenu son doctorat en biostatistique en 2021 à Brown University (Etats Unis), elle a travaillé en tant que chercheuse pour une entreprise américaine dans le domaine de la santé pendant deux ans. Son expérience porte sur l’analyse des données manquantes et l’inférence causale dans les études observationnelles. Elle a rejoint l’équipe EpiAgeing du CRESS en 2024 pour étudier l’accès aux aides et aménagements en France en utilisant des méthodes d’analyse d’enquêtes. Ma recherche porte également sur l’analyse de la base de données UK Biobank afin de mieux comprendre l’hétérogénéité des profils de multimorbidité.