Organisation du cours

L’objectif de ce cours est l’apprentissage de la programmation en Python et R (aspects intermédiaire et avancé). Ce cours utilise l’analyse de données comme étude de cas, Python et R étant des outils essentiels pour l’analyse de données. Nous suivons une démarche comprenant :

  • le rappel des concepts fondamentaux de programmation (en Python et R),

  • la manipulation des structures de données,

  • l’analyse et manipulation des données,

  • la visualisation et le dashboarding.

A la fin de ce cours l’étudiant.e doit être capable de :

  • Démontrer une bonne compréhension des concepts fondamentaux de programmation (en Python et R)

  • Représenter clairement les différences de syntaxe entre Python et R

  • Utiliser convenablement les structures de données de base en Python (listes, dictionnaires, tuples) et en R (vecteurs, data frames, listes)

  • Utiliser Python et/ou R pour importer, nettoyer et transformer des jeux de données de formats variés (CSV, Excel, JSON)

  • Effectuer des opérations statistiques (moyennes, médianes, corrélations) variées sur des données en utilisant Python et/ou R

  • Créer des visualisations de données en utilisant les bibliothèques appropriées (matplotlib, seaborn pour Python ; ggplot2 pour R)

  • Choisir l’outil (Python et/ou R) adéquat pour les tâches du quotidien

Pédagogie

La pédagogie utilisée est mixte. Nous alternerons des :

  • Cours magistraux pour la clarification des concepts

  • Séances de laboratoires basées sur le modèle de l’apprentissage par soi-même et par projet

  • Travaux pratiques à faire après chaque module

Par conséquent, les étudiants doivent impérativement travailler de manière autonome au jour le jour pour graduellement comprendre et développer/affiner leurs compétences.

Répartition du cours

Le cours est divisé en 3 parties distinctes :

  1. Partie 1 : Introduction aux fondamentaux - Introduction à la programmation et aux technologies émergentes, fondamentaux de Python et R

  2. Partie 2 : Analyse de données et visualisation avec Python et R - Manipulation et nettoyage de données, visualisation, et création d’applications web interactives

  3. Partie 3 : Projet d’application - Mise en pratique sur des données réelles

Évaluation

L’évaluation du cours se compose de trois éléments principaux :

1. Examen écrit sur table (30%)

L’examen comprend deux parties :

  • Partie 1 : QCM - Questions de connaissance et de compréhension sur les structures de données Python et R

  • Partie 2 : Code - Exercices pratiques évaluant la maîtrise des notions vues en cours (souvent complétion de code)

2. Travaux Pratiques (40%)

Les TPs incluent :

  • TP0 : CodingBat (Bonus - points supplémentaires)

  • TP1 : Fondamentaux de Python et R - Plus ou Moins (Modules 1 et 2)

  • TP2 : Niveau Intermédiaire - Le Pendu (Modules 1 et 2)

  • TP3 : Analyse de données et visualisation avec Streamlit (Modules 3 et 4)

  • TP4 : Analyse de données et visualisation avec Shiny (Modules 3 et 4)

  • TD-Exercices : 50 exercices (Tous les modules)

3. Projet d’analyse de données (30%)

Le projet comprend :

  • Partir d’un problème réel posé, avec un jeu de données en appui et formuler des questions de recherche.

  • Développer un code Python/R fonctionnel pour répondre aux questions de recherche.

  • Créer un dashboard avec Streamlit/Shiny pour visualiser les résultats.

  • Rendre les livrables souhaités.

Note finale = 30% Examen + 40% TPs + 30% Projet

Contact et communication

Les communications se feront par mail.

Email:

John Aoga

Cours Open-Source

Les sources de ce site web sont open-source et sur GitHub. N’hésitez pas à faire des pull requests si vous voyez des erreurs ou choses à corriger.

La licence utilisée est Creative Commons Attribution-ShareAlike 4.0 International License:

CC-BY-SA