.. _intro: ********************* Organisation du cours ********************* L'objectif de ce cours est l'apprentissage de la programmation en Python et R (aspects intermédiaire et avancé). Ce cours utilise l'analyse de données comme étude de cas, Python et R étant des outils essentiels pour l'analyse de données. Nous suivons une démarche comprenant : - le rappel des concepts fondamentaux de programmation (en Python et R), - la manipulation des structures de données, - l'analyse et manipulation des données, - la visualisation et le dashboarding. A la fin de ce cours l'étudiant.e doit être capable de : * Démontrer une bonne compréhension des concepts fondamentaux de programmation (en Python et R) * Représenter clairement les différences de syntaxe entre Python et R * Utiliser convenablement les structures de données de base en Python (listes, dictionnaires, tuples) et en R (vecteurs, data frames, listes) * Utiliser Python et/ou R pour importer, nettoyer et transformer des jeux de données de formats variés (CSV, Excel, JSON) * Effectuer des opérations statistiques (moyennes, médianes, corrélations) variées sur des données en utilisant Python et/ou R * Créer des visualisations de données en utilisant les bibliothèques appropriées (matplotlib, seaborn pour Python ; ggplot2 pour R) * Choisir l'outil (Python et/ou R) adéquat pour les tâches du quotidien Pédagogie ======================================= La pédagogie utilisée est mixte. Nous alternerons des : * Cours magistraux pour la clarification des concepts * Séances de laboratoires basées sur le modèle de l'apprentissage par soi-même et par projet * Travaux pratiques à faire après chaque module Par conséquent, les étudiants doivent impérativement travailler de manière autonome au jour le jour pour graduellement comprendre et développer/affiner leurs compétences. Répartition du cours ==================== Le cours est divisé en 3 parties distinctes : 1. **Partie 1 : Introduction aux fondamentaux** - Introduction à la programmation et aux technologies émergentes, fondamentaux de Python et R 2. **Partie 2 : Analyse de données et visualisation avec Python et R** - Manipulation et nettoyage de données, visualisation, et création d'applications web interactives 3. **Partie 3 : Projet d'application** - Mise en pratique sur des données réelles Évaluation ======================================= L'évaluation du cours se compose de trois éléments principaux : **1. Examen écrit sur table (30%)** L'examen comprend deux parties : * **Partie 1 : QCM** - Questions de connaissance et de compréhension sur les structures de données Python et R * **Partie 2 : Code** - Exercices pratiques évaluant la maîtrise des notions vues en cours (souvent complétion de code) **2. Travaux Pratiques (40%)** Les TPs incluent : * **TP0** : `CodingBat `_ (Bonus - points supplémentaires) * **TP1** : Fondamentaux de Python et R - Plus ou Moins (Modules 1 et 2) * **TP2** : Niveau Intermédiaire - Le Pendu (Modules 1 et 2) * **TP3** : Analyse de données et visualisation avec Streamlit (Modules 3 et 4) * **TP4** : Analyse de données et visualisation avec Shiny (Modules 3 et 4) * **TD-Exercices** : 50 exercices (Tous les modules) **3. Projet d'analyse de données (30%)** Le projet comprend : * Partir d'un problème réel posé, avec un jeu de données en appui et formuler des questions de recherche. * Développer un code Python/R fonctionnel pour répondre aux questions de recherche. * Créer un dashboard avec Streamlit/Shiny pour visualiser les résultats. * Rendre les livrables souhaités. **Note finale = 30% Examen + 40% TPs + 30% Projet** Contact et communication ======================================= Les communications se feront par mail. :Email: `John Aoga `_ Cours Open-Source ======================================= Les sources de ce site web sont open-source et sur `GitHub `_. N'hésitez pas à faire des pull requests si vous voyez des erreurs ou choses à corriger. La licence utilisée est Creative Commons Attribution-ShareAlike 4.0 International License: .. image:: https://i.creativecommons.org/l/by-sa/4.0/88x31.png :alt: CC-BY-SA