Organisation du cours
L’objectif de ce cours est l’apprentissage de la programmation en Python et R (aspects intermédiaire et avancé). Ce cours utilise l’analyse de données comme étude de cas, Python et R étant des outils essentiels pour l’analyse de données. Nous suivons une démarche comprenant :
le rappel des concepts fondamentaux de programmation (en Python et R),
la manipulation des structures de données,
l’analyse et manipulation des données,
la visualisation et le dashboarding.
A la fin de ce cours l’étudiant.e doit être capable de :
Démontrer une bonne compréhension des concepts fondamentaux de programmation (en Python et R)
Représenter clairement les différences de syntaxe entre Python et R
Utiliser convenablement les structures de données de base en Python (listes, dictionnaires, tuples) et en R (vecteurs, data frames, listes)
Utiliser Python et/ou R pour importer, nettoyer et transformer des jeux de données de formats variés (CSV, Excel, JSON)
Effectuer des opérations statistiques (moyennes, médianes, corrélations) variées sur des données en utilisant Python et/ou R
Créer des visualisations de données en utilisant les bibliothèques appropriées (matplotlib, seaborn pour Python ; ggplot2 pour R)
Choisir l’outil (Python et/ou R) adéquat pour les tâches du quotidien
Pédagogie
La pédagogie utilisée est mixte. Nous alternerons des :
Cours magistraux pour la clarification des concepts
Séances de laboratoires basées sur le modèle de l’apprentissage par soi-même et par projet
Travaux pratiques à faire après chaque module
Par conséquent, les étudiants doivent impérativement travailler de manière autonome au jour le jour pour graduellement comprendre et développer/affiner leurs compétences.
Répartition du cours
Le cours est divisé en 3 parties distinctes :
Partie 1 : Introduction aux fondamentaux - Introduction à la programmation et aux technologies émergentes, fondamentaux de Python et R
Partie 2 : Analyse de données et visualisation avec Python et R - Manipulation et nettoyage de données, visualisation, et création d’applications web interactives
Partie 3 : Projet d’application - Mise en pratique sur des données réelles
Évaluation
L’évaluation du cours se compose de trois éléments principaux :
1. Examen écrit sur table (30%)
L’examen comprend deux parties :
Partie 1 : QCM - Questions de connaissance et de compréhension sur les structures de données Python et R
Partie 2 : Code - Exercices pratiques évaluant la maîtrise des notions vues en cours (souvent complétion de code)
2. Travaux Pratiques (40%)
Les TPs incluent :
TP0 : CodingBat (Bonus - points supplémentaires)
TP1 : Fondamentaux de Python et R - Plus ou Moins (Modules 1 et 2)
TP2 : Niveau Intermédiaire - Le Pendu (Modules 1 et 2)
TP3 : Analyse de données et visualisation avec Streamlit (Modules 3 et 4)
TP4 : Analyse de données et visualisation avec Shiny (Modules 3 et 4)
TD-Exercices : 50 exercices (Tous les modules)
3. Projet d’analyse de données (30%)
Le projet comprend :
Partir d’un problème réel posé, avec un jeu de données en appui et formuler des questions de recherche.
Développer un code Python/R fonctionnel pour répondre aux questions de recherche.
Créer un dashboard avec Streamlit/Shiny pour visualiser les résultats.
Rendre les livrables souhaités.
Note finale = 30% Examen + 40% TPs + 30% Projet
Contact et communication
Les communications se feront par mail.
- Email:
Cours Open-Source
Les sources de ce site web sont open-source et sur GitHub. N’hésitez pas à faire des pull requests si vous voyez des erreurs ou choses à corriger.
La licence utilisée est Creative Commons Attribution-ShareAlike 4.0 International License: