Ingénieur.e de Recherche - Entrepôt de Données de Santé 100% ETP

CDD
2-5 ans
Cadre
Dès que possible
Horaires normaux - Jour
Temps plein
Cette offre expire le 30/04/2026
Ingénieur.e de Recherche - Entrepôt de Données de Santé 100% ETP

Description du poste

  1. Situé au cœur de la ville d’Angers et du Campus santé, le CHU d’Angers est un acteur économique majeur au sein de la Région Pays de la Loire.
  2. Le Centre de Données Cliniques (CDC) du CHU d’Angers exploite l’entrepôt de données de santé eHOP.
  3. A l’interface entre recherche, production de soin, systèmes d’information et innovation numérique, dans un contexte d’évolution continue des usages de la donnée (recherche, qualité des soins, pilotage médico-économique, IA, valorisation scientifique) le CDC développe une activité de soutien à la recherche clinique, l’innovation médicale et le pilotage institutionnel.
  4. Dans un contexte d'exploitation croissante des données de vie réelle (real-world data), le CDC recrute un(e) ingénieur(e) Data-Scientist expérimenté(e), capable de travailler de manière autonome sur l'analyse de données hospitalières complexes et d'en valoriser les résultats auprès des équipes médicales et scientifiques.
  5. MISSIONS ET ACTIVITES
  6. Data Science & analyses sur données de vie réelle
  7. Identifier, extraire et explorer les données pertinentes issues de l'entrepôt eHOP et du SI Hospitalier, en s'appuyant sur une maîtrise solide du SQL
  8. Évaluer et documenter la qualité des données avant toute analyse (exhaustivité, cohérence, codage)
  9. Mener des analyses statistiques et développer des modèles adaptés aux données de vie réelle, depuis l'exploration descriptive jusqu'à la modélisation prédictive ou d'aide à la décision.
  10. Contribuer à des projets de recherche méthodologiquement avancés (essais émulés, inférence causale, données synthétiques, machine learning, …)
  11. Assurer la restitution et la vulgarisation des résultats auprès des équipes médicales
  12. Accompagnement scientifique
  13. Participer à la rédaction des protocoles de recherche et à leur formalisation méthodologique
  14. Participer à la rédaction scientifique et technique
  15. Contribuer aux réponses aux appels à projets
  16. Coordination projet
  17. Recueillir et formaliser les besoins des investigateurs
  18. Intéragir et collaborer avec les autres ingénieurs du CDC (TAL, data ingénieur) pour la préparation et la mise à disposition des données, ainsi qu’avec les différents partenaires : DIM, DSN, DRCI, prestataire eHOP (Enovacom), cliniciens chercheurs
  19. Participer à la planification et au suivi des projets de recherche
  20. Contribuer aux documents techniques (spécifications, documentation)
  21. Garantir la qualité, la traçabilité et la conformité réglementaire (RGPD)

Autres détails

Profil recherché

COMPETENCES ATTENDUES

  1. Compétences métier
  2. Maîtrise opérationnelle de SQL pour l’accès, l’exploration et la transformation des données.
  3. Capacité à évaluer, documenter et gérer la qualité des données de vie réelle issue de l’entrepôt
  4. Maîtrise des outils mathématiques et statistiques utilisées dans les modèles de machine learning.
  5. Maîtrise des outils de machine learning : Boosting, Random Forest, MLP,…
  6. Compréhension des enjeux de validation et d'interprétabilité (SHAP, importance de variables)
  7. Une expérience sur des approches de modélisation générative (VAE, GANs) sera valorisée, dans le cadre de projets exploratoires liés au partage sécurisé de données ou à l'imputation avancée de données manquantes — sans constituer un prérequis au poste.
  8. Capacité à présenter et vulgariser des méthodes, et résultats complexes de façon claire et accessible
  9. Maîtrise des outils de visualisation des données
  10. Maîtrise opérationnelle de Python et R.

Environnement santé (atout majeur)

  1. Connaissance sur les systèmes d'information hospitaliers (DPI, PMSI, laboratoire, imagerie, flux standardisé)
  2. Connaissance des terminologies médicales / ontologies / standards de données en santé (CIM, SNOMED, LOINC, OMOP, FHIR…)
  3. Compréhension des données hospitalières (flux, codage, complétude)
  4. Sensibilité aux enjeux RGPD et données de santé

Culture technique

  1. Versionning de code (git,…)
  2. Notions de pipeline de données

Compétences transversales

  1. Fort attrait pour le domaine de la santé et la recherche clinique
  2. Capacité à dialoguer avec des cliniciens et des équipes techniques
  3. Forte capacité à expliciter et défendre une démarche scientifique
  4. Esprit critique sur les protocoles et les données
  5. Autonomie et rigueur méthodologique
  6. Curiosité intellectuelle et goût pour la veille scientifique et méthodologique
  7. Anglais scientifique

ENVIRONNEMENT

Positionnement

Centre de Données Cliniques (CHU Angers, Direction Recherche Innovation, Département Science de la Données)

Le/la candidat(e) rejoint une équipe d’ingénieurs et de scientifiques et contribue aux projets de manière autonome et travaille en étroite collaboration avec :

  1. les ingénieurs data et data scientists de l’équipe,
  2. les équipes de la Direction de la Recherche et de l’Innovation,
  3. la Direction des Services Numériques,
  4. les cliniciens et porteurs de projets de recherche,
  5. le prestataire eHOP (Enovacom).

L’activité est fortement transversale entre recherche, production de soin, pilotage hospitalier et système d’information.

Les ingénieurs du CDC participent à des projets institutionnels stratégiques autour de la donnée hospitalière

Dimension territoriale et partenariale

L’ingénieur(e) interviendra également sur :

  1. des projets multicentriques, notamment dans le cadre du Ouest Data Hub,
  2. des collaborations inter-établissements au sein du GHT et à l’échelle régionale,
  3. des projets menés en partenariat avec des industriels du secteur de la santé et des technologies numériques.

Le poste s’inscrit dans une dynamique d’ouverture et de structuration territoriale de la donnée de santé, avec des enjeux de standardisation, d’interopérabilité et de valorisation scientifique.

Environnement scientifique et valorisation

Selon l’intérêt et l’implication du/de la candidat(e), des opportunités de :

  1. participation et co-publication d’articles scientifiques,
  2. communications dans des congrès nationaux et internationaux,
  3. valorisation des travaux conduits au sein du Centre de Données Cliniques,
  4. collaboration avec des équipes académiques régionales, nationales ou dans le cadre de projets multicentriques (ex. Ouest Data Hub).

PROFIL RECHERCHE

  1. Bac+5 minimum : ingénieur ENSAI, ISUP, ou INSA option données/statistiques ; Master 2 en statistiques, data science, mathématiques appliquées, ou informatique spécialité IA/data science, données massives en santé publique ;
  2. Expérience de 3 ans minimum en analyse de données, idéalement sur des données de santé ou des données observationnelles ;
  3. Doctorat ou expérience équivalente en R&D (Statistiques, Science des données/IA, Informatique, Mathématiques appliquées, données massives en santé publique, disciplines connexes orientées données).

AUTRES INFORMATIONS SUR LE POSTE

Poste en CDD à temps plein 39h/semaine, 28J CA, 20J RTT

Pour postuler, merci de déposer votre CV et lettre de motivation sur la plateforme Mstaff.

Description de l'établissement

Les 10 bonnes raisons de venir au CHU d’Angers :

🌟 Un cadre de travail attractif :

🚲 Une Mobilité facilitée et responsable :

🎓 Une offre sociale complète:

💙Un hôpital qui prend soins de vous :

🎓Un pôle de formation d’excellence :

De nombreux instituts et écoles de formation intégrés :

Trois centres de formation continue certifiés Qualiopi :

🔬Un établissement de recherche et d'innovation :

Plus de 1 300 projets de recherche en cours :

🏥Une expertise et des technologies de pointe :

🚀Une institution tournée vers l’avenir :

• Fort de plus de huit siècles d’histoire, le CHU d’Angers s’engage dans une transformation majeure avec le projet Convergence

• Un ambitieux programme de modernisation visant à :

🏗Un projet structurant en 3 phases :

• Phase 1 (2022 – 2029) : construction d’un bâtiment regroupant urgences, blocs opératoires, imagerie et soins critiques

• Phase 2 (2029 – 2033) : création d’un second bâtiment dédié à des services d’hospitalisation modernisés et ergonomiques

• Phase 3 (2033 – 2037) : restructuration du bâtiment Larrey pour finaliser l’organisation du site

🌱Un objectif commun

Concilier excellence médicale, innovation technologique et qualité de vie au travail, au service des besoins de santé de la population.

Pour aller plus loin : https://chu-angers.mstaff.co