Big Data Engineering en santé

Code UE : USR236

  • Cours + travaux pratiques
  • 6 crédits

Responsable(s)

Mounia N. HOCINE

Public, conditions d’accès et prérequis

  • Cet enseignement s'adresse à un public souhaitant se former à l’utilisation des outils modernes de gestion de données dans le domaine de la santé. 
  • Il est ouvert sans condition d’accès. Toutefois, de bonnes bases en informatique (niveau licence) sont nécessaires pour bien suivre les cours.
  • Une remise à niveau en SQL et Python est dispensée par Mounia N. HOCINE en début de la formation.
  • Penser à télécharger et à vous entrainer sur des applications ludiques en programmation comme Mimo, en amont à la formation.

Objectifs pédagogiques

Le but est de présenter une synthèse des méthodes modernes de stockage, accès, structuration et exploitation de données, avec un accent mis sur les défis spécifiques pour les catégories de données utilisées en santé (données image, données structurées, etc.) 
Des aspects essentiels en santé comme la sécurité et l’anonymisation de données sont abordés aussi.

Compétences visées

Comprendre les enjeux des entrepôts de données modernes dans le domaine de la santé
Comprendre la mise en place et l'utilisation des outils de base de l’ingénierie des données : interrogation SQL, outils pour les entrepôts de données massives, etc.
 
 

Contenu

  • Fondamentaux du Data Engineering et Big Data : Rania Assab
  • Bases de données à grande échelle : modélisation et structuration : Philippe Rigaux
  • Data Lakes et Data Warehouse. Sécurisation des données : Audrey Duval
  • Data Lakes, Data Warehouse
  • Bases de données NoSQL : illustration avec Cassandra : Philippe Rigaux & Alanna Genin
  • Extraction de Données d’un Système d’Information et utilisation d’ETL : Rania Assab
  • Gestion et normalisation des données images et capteurs : Marin Ferecatu
  • Gouvernance des données : pilotage, organisation du SI et Data Management Plan : Béa Arruabarrena 
  • Ingénierie de connaissances et technologies du web sémantique : Nada Mimouni
  • Indexation, recherche et analyse de données textuelles (Elastic Search) : Philippe Rigaux
  • Programmation Parallélisée et clusters de Calcul (Spark, Hadoop) : Rania Assab
  • Infrastructures et déploiement : Audrey Duval 
  • Le web sémantique : concepts clés et applications : Nada Mimouni       
 

Modalité d'évaluation

QCM, travaux pratiques et data challenges

Cette UE apparaît dans les diplômes et certificats suivants

Chargement du résultat...
Patientez
Intitulé de la formation
Type
Modalité(s)
Lieu(x)
Lieu(x)
Lieu(x)
Intitulé de la formation Type Modalité(s) Lieu(x)

Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.

Enseignement non encore programmé