Jerome Saracco

Jérôme SARACCO

Statisticien (Professeur des Universités
Institut Polytechnique de Bordeaux)

Ecole Nationale Supérieure de Cognitique (ENSC Bordeaux INP)

Institut de Mathématiques de Bordeaux, UMR CNRS 5251, équipe OptimAl

Inria Bordeaux Sud Ouest, équipe ASTRAL

Email : jerome.saracco« @ »ensc.fr / jerome.saracco« @ »inria.fr

Présentation synthétique de mes activités scientifiques

Mes activités de recherche portent sur différents thèmes en Statistique. L’ensemble de mes travaux s’inscrit dans le cadre de la modélisation statistique au sens large. Ils s’articulent autour de plusieurs grands domaines :

  • la statistique multidimensionnelle,
  • la régression semi-paramétrique et non-paramétrique,
  • l’estimation non-paramétrique de grandeurs telles que le mode ou les quantiles conditionnels,
  • ainsi que l’analyse des données de grande dimension et la classification.

Certains résultats théoriques sont obtenus dans le cadre d’observations complètes, d’autres en présence de censure. Je tiens aussi à mettre en avant l’omniprésence des aspects pratiques et des développements informatiques dans la plupart de ces différentes recherches. Les fondements de plusieurs travaux proviennent d’applications réelles lors de collaborations interdisciplinaires avec des industriels ou des chercheurs du monde académique d’autres domaines scientifiques. Mes collaborations pluridisciplinaires actuelles ou récentes sont les suivantes :

  • le groupe d’imagerie neurofonctionnelle (GIN) de l’UMR CNRS 5293 (IMM, Institut des Maladies Neurodégénératives, Bordeaux) avec Bernard Mazoyer, Marc Jolliot et Nathalie Tzourio-Mazoyer,
  • l’équipe Biostatistique du centre INSERM U1219 (Bordeaux Population Health, Bordeaux) avec Rodolphe Thiebaud, Robien Genuer et Hadrien Lorenzo,
  • l’INRA UMR 1213 Herbivores (Clermont-Ferrand) avec Marie-Pierre Ellies-Oury et Brigitte Picard,
  • l’équipe Cognitique de l’UMR CNRS 5218 (IMS, Intégration du Matériau au Système, Bordeaux),
  • l’IAE de Bordeaux avec Stéphane Trébucq, le titulaire de la chaire sur le capital humain (Fondation Bordeaux Université),
  • l’équipe EADT (Environnement, Acteurs et Dynamiques du Territoire) de l’IRSTEA (Institut National de Recherche en Sciences et Technologies pour l’Environnement et l’Agriculture) avec Vanessa Kuentz-Simonet et Tina Rambonilaza.

Comme on peut le voir avec mes diverses collaborations, mes domaines d’application (liste non exhaustive) sont très variés : biologie, biométrie, environnement, épidémiologie, économie, fiabilité, médecine, psychologie, cognitique, …

On peut regrouper mes travaux  en quatre axes principaux de recherche :

  • la réduction de dimension et la régression semi-paramétrique au moyen de méthodes de type SIR (Sliced Inverse Regression),
  • l’estimation non-paramétrique de quantiles conditionnels univariés ou multivariés,
  • la statistique multidimensionnelle : analyse factorielle des données mixtes, classification de variables, classification sous contraintes géographiques, données manquantes, etc.,
  • la transdisciplinarité dans le cadre des collaborations précédemment citées,

auxquels s’ajoutent divers travaux « satellites » comme par exemple en prévision de séries chronologiques, en analyse des niveaux d’expression en génomique, ou bien encore en sélection de modèles avec des données de survie, etc.

La liste de mes publications dans des revues en Statistique, dans des revues d’autres domaines scientifiques ou dans des revues de transfert (liste incluant également les chapitres d’ouvrage, les rapports techniques, les brevets industriels, ainsi que les articles actuellement soumis ou en révision) est disponible ici.

La liste des mes conférences nationales et internationales ainsi que de mes séminaires invités récents est disponible ici.

La liste des packages R qui ont été développés avec mes collaborateurs est disponible ici.

La liste des thèses  (PhD thesis) que j’ai dirigées ou que je dirige actuellement est disponible ici.

Je suis titulaire de la PEDR (Prime d’Encadrement Doctoral et de Recherche) ou PES (Prime d’Excellence Scientifique) depuis 2003 :

  • PEDR de 2019 à 2023 (en cours),
  • PEDR de 2015 à 2019,
  • PES de 2011 à 2015,
  • PEDR de 2007 à 2011,
  • PEDR de 2003 à 2007.

Participation à des jurys de thèse et de HDR

Voici ci-après la liste des thèses/HDR dont j’ai été récemment (depuis 2013) rapporteur en France ou à l’étranger :

  • Julien GIBAUD, « Régression linéaire généralisée sur composantes supervisées pour la modélisation jointe des réponses », Doctorat de l’Université de Montpellier, Décembre 2022.
  • Henry BRUNET, « Analyse d’images en élevage aviaire », Doctorat de l’Université de Toulouse, Juillet 2022.
  • Florian DUSSAP , « New insights on inverse problems: multidimensionalm strategies for deconvolution or regression, and ruin probability estimation », Doctorat de l’Université Paris Cité, Juin 2022.
  • Pierrick LEGRAND,  « Artificial evolution, fractal analysis and applications », HDR de l’Université de Bordeaux, Novembre 2019.
  • Kévin DUARTE,  « Aide à la décision médicale et télémédecine dans le suivi de l’insuffisance cardiaque », Doctorat de l’Université de Lorraine, Décembre 2018.
  • Rémi SERVIEN, « From non-parametric estimation to biostatistics », HDR de l’Université de Toulouse, Novembre 2018.
  • Clémentine BARREYRE, « Statistique en grande dimension pour la détection d’anomalies dans les données fonctionnelles issues des satellites », Doctorat de l’Université de Toulouse, Mai 2018.
  • Aurore ARCHIMBAUD, « Méthodes statistiques de détection d’observations atypiques pour des données en grande dimension », Doctorat de l’Université de Toulouse, Janvier 2018.
  • Maxime BRUNIN, « Etude du compromis précision statistique – temps de calcul », Doctorat de l’Université de Lille, Janvier 2018.
  • Aboubacar AMIRI, « Contribution à la statistique non paramétrique pour des flux de données », HDR de l’Université de Lille, Janvier 2018.
  • Alessandro CHIANCONE, « Réduction de dimension via Sliced Inverse Regression : Idées et nouvelles propositions », Doctorat de l’Université de Grenoble, Octobre 2016.
  • Myriam TAMI, « Approche EM pour modèles multi-blocs à facteurs à une équation structurelle », Doctorat de l’Université de Montpellier, Juillet 2016.
  • Clément VITAL, « Scoring pour le risque de crédit : variable réponse polytomique, sélection de variables, réduction de la dimension, applications », Doctorat de l’Université Rennes 1, Juillet 2016.
  • Hanen BEN SALAH, « Gestion des Actifs Financiers: de l’Approche Classique à la Modélisation non Paramétrique en Estimation du DownSide Risk pour la Constitution d’un Portefeuille Efficient », Doctorat de l’Université de Lyon 1 et l’Université de Tunis 1, Décembre 2015.
  • Hussein Hashem, « Regularized and robust regression methods for high-dimensional data », PhD Brunel University (GB), Octobre 2014.
  • Rachid BOUMAZA, « Contributions à l’analyse de données ternaires et à l’analyse sensorielle en horticulture ornementale », HDR de l’Université d’Angers, Décembre 2013.
  • Sultana DIDI, « Quelques propriétés asymptotiques des processus stationnaires à temps continu », Doctorat de l’Université Pierre et Marie Curie, Paris 6, Novembre 2013.
  • Romain BAR, « Développement de méthodes d’analyse de données en ligne », Doctorat de l’Université de Lorraine, Octobre 2013.
  • Amanda SHAKER, « Combining Dimension Reduction Methods », PhD La Trobe University (Australie), Avril 2013.

Voici ci-après la liste des thèses/HDR dont j’ai été récemment (depuis 2019) président du jury ou membre  du jury en France ou à l’étranger :

  • Vincent VANDEWALLE, « Contribution to model-based clustering of heterogeneous data », HDR de l’Université de Lille, Janvier 2021 (président).
  • Loïc LABACHE, « Création d’atlas des réseaux cérébraux sous-tendant les fonctions cognitives latéralisées, application à l’Étude de la variabilité inter-individuelle du langage », Doctorat de l’Université de Bordeaux, Octobre 2020 (co-directeur).
  • Hadrien LORENZO,  « Analyse supervisée multibloc en grande dimension », Doctorat de l’Université de Bordeaux, Novembre 2019 (co-directeur).
  • Cynthia PERIER,  « Analyse quantitative des données de routine clinique pour le pronostic précoce en oncologie », Doctorat de l’Université de Bordeaux, Novembre 2019.

Organisation de colloques, conférences ou journées d’étude

  • Responsable et organisateur de Rencontres des jeunes statisticien-ne-s (RJS) sous l’égide de la Société Française de Statistique (SFdS), de 2011 à 2015.
  • Organisation de StatLearn 2013 (8-9 avril) à Bordeaux.
  • Membre du comité d’organisation des premières rencontres R en 2012 à Bordeaux (2-3 juillet), et fondateur de ces rencontres. Depuis ces premières rencontres, cette manifestation scientifique se déroule chaque année en France avec un succès croissant.
  • Vice-président des 41èmes Journées de Statistique à Bordeaux en 2009 (25-29 mai).
  • Membre du comité d’organisation des 36èmes Journées de Statistique à Montpellier en 2004.

Invitations dans des universités étrangères

Voici quelques invitations récentes dans des universités étrangères :

  • Faculté des Sciences de l’Université de Monastir, depuis 2016, invitation par Leila Ben Abdelghani ;
  • Honk Hong Baptist University (Chine), novembre 2015, invitation par Lixing Zhu ;
  • Brunel University (UK), octobre 2014, invitation par Keming Yu ;
  • La Trobe University (Australie), novembre 2013, invitation par Luke Prendergast ;
  • Cambridge University (UK), novembre 2012, inviation par Sylvia Richardson ;
  • Technical University of Dormund (Allemagne), septembre 2010, invitation par Holger Dette.

Contrats de recherche (appels à projet, ou de gré à gré)


Contrats de recherche évalués suite à appel à projet

  • 2020-2021 : Étude dans le cadre du GIS ALBATROS (avec THALES) « Algorithme de réduction de données vibratoires pour la maintenance préventive », incluant le financement d’un ingénieur (aujourd’hui en thèse CIFRE, Guillaume Cottin), co-encadrants du projet Franck Cazaurand (Université de Bordeaux, IMS) et Loic Lavigne (ENSPIMA Bordeaux INP, IMS).
  • 2014-2015 : porteur du projet InterLabEx CPU-TRAIL « Méthodes statistiques avancées pour l’analyse de base de données multidimensionnelles d’imagerie cérébrale », incluant le financement de 20 mois de post-doc (post-doctorante : Solveig Badillo).
  • 2007-2010 : porteur du projet « Recherche » Région Aquitaine pour l’Institut de Mathématiques de Bordeaux sur le thème « Estimation récursive pour des modèles semi-paramétriques », incluant le financement d’une bourse de thèse (doctorante : Thi Mong Gnoc Nguyen).
  • 2004-2007 : porteur du projet de recherche Région Bourgogne « Accueil de nouvelles équipes de recherche » (programme FABER), incluant le financement d’une bourse de thèse (doctorant : Mohamed Chaouch).

Contrats de recherche de gré à gré

Nombreux contrats industriels dans le cadre de collaboration avec l’Inria et l’IMB (EDF, VNF, Thales, Danone, Lyonnaise des eaux, Chanel, etc.). Ci-après, voici quelques exemples de ces contrats industriels :

  • 2019-2022 : collaboration entre Sartorius et l’équipe Inria CQFD/ASTRAL, incluant le financement de deux années de post-doctorat d’Hadrien Lorenzo, portant sur la thématique « high dimensional datasets  with multi-block structures and missing values in supervised context ».
  • 2019-2020 : Contrat avec VNF (Voies Navigables de France) portant sur la modélisation du flux sur le Canal des deux mers, l’optimisation de la gestion de l’eau et l’implantation de nouvelles bases de location, en fonction de différents scénarios.
  • 2017-2018 : Contrat avec VNF (Voies Navigables de France) portant sur la modélisation du flux sur le Canal des deux mers et du temps d’attente aux écluses en fonction de différents scénarios.
  • 2012-2014 : Contrat avec la Lyonnaise des Eaux (Lyre) portant sur la mise en place d’un modèle de fuite multi-états en secteur hydraulique instrumenté. Ce projet a permis de financer une thèse CIFRE, (docotorant : Karim Claudio).
  • 2011-2013 : Contrat avec Thales Optronique portant sur des problématiques de fiabilité de HUMS. Ce projet a permis de financer une thèse CIFRE (doctorante : Camille Baysse).
  • 2009-2011 : Contrat avec VNF (Voies Navigables de France) portant sur la modélisation du trafic sur le Canal des deux mers et du temps d’attente aux écluses, ainsi que sur la prévision de trafic et du temps d’attente en fonction de différents scénarios.
  • 2010 : Contrat avec Air Breizh portant sur le thème « Identification et recherche de la contribution de sources de particules fines sur l’agglomération de Saint Malo ». Le montant de ce projet est de 20 000 euros.
  • 2009-2011 : Contrat de recherche avec EDF R& D portant sur des problèmes de classification et modélisation de courbes de charge.
  • 2009 : Contrat de recherche avec Danone Research portant sur des problématiques de contrôle de qualité.
  • 2000-2006 : Contrat de recherche avec le Centre de Recherches et d’Investigations Epidermiques et Sensorielles (CE.R.I.E.S.) portant sur l’étude statistique des propriétés biophysiques de la peau, via les courbes ou hypersurfaces de référence.