Répartition des enseignements
La formation, qui s’étale sur 7 mois, propose 90 heures d’enseignement incluant :
Elle est dispensée en blended-learning :
- 24 heures d’enseignements en e-learning,
- 36 heures d’enseignements en présentiel,
- 20 heures de projets en groupes,
- 10 heures de conférences.
Enseignements
- Programmation R et Python
- Modélisation statistique
- Exploration multidimensionnelle
- Principes de l’apprentissage statistique
- Infrastructures logicielles pour le Big Data
- Algorithmes classiques d’optimisation
- Méthodes de classifications supervisées
- Techniques de virtualisation et de containerisation
- Algorithmes stochastiques plus sophistiquées
La formation comporte deux projets à réaliser en groupes.
Les conférences ont pour objectif d’illustrer, par des exemples concrets, des cas d’usage du Big Data et des sciences des données dans l’industrie, mais aussi de mettre en lumière les enjeux éthiques et de respect de la vie privée associés au traitement de données.