Fribourg Pérolles, vendredi 13 mai 2022, 9:00-17:00
(si légalement possible en mode présentiel, en cas de confinement en mode à distance)
Cette formation est conçue pour toute personne désireuse de comprendre les fondements du “machine learning”. Elle est donnée en anglais par Prof. Martin Huber de l’Université de Fribourg.
Ce cours propose une introduction au « machine learning » avec le logiciel R, mais seulement une connaissance de base de la syntaxe de R est réquise.
Le « Machine learning » a pour objectif de prédire le comportement d’une variable d’intérêt, comme les ventes ou le chiffre d’affaires, à partir de l’identification d’interactions de facteurs potentiellement pertinents (« predictors ») comme le prix, la qualité, la météo, la publicité, etc… Fondamentalement, les méthodes statistiques employées permettent un apprentissage à partir de données antérieures pour prédire la variable d’intérêt dans le futur. Le cours présente en premier lieu la base intuitive et l’utilité du « machine learning » pour la prédiction et la prise de décision. Ensuite, nous introduisons différentes approches statistiques telles que l’arborescence (tree-based methods). Celles-ci seront illustrées et pratiquées avec le logiciel « R » et son interface « R-Studio » sur des données réelles.
Objectifs
- comprendre l’idée et les objectifs du « machine learning »
- évaluer les avantages et désavantages de méthodes statistiques alternatives
- être capable d’utiliser les méthodes de “machine learning”, abordées à l’aide du logiciel « R » et son interface « R-Studio », et appliquées à des données réelles (voir aussi notre cours d’introduction à R)
Contenu
- Introduction au concept et au but du « machine learning »
- Régression linéaire et non- linéaire (OLS, logit regression)
- Sélection et retrait des variables (lasso et ridge regression)
- Approches d’arborescence (trees, bagging, random forests)
- Validation de modèles (cross-validation)
- Evaluation de performance (out-of-sample testing)
- Application de toutes les méthodes en utilisant l’apprentissage
- Logiciel “R” et son interface “R Studio”
Support de cours
Diapositives de cours et code R des illustrations de méthodes
Référence: “An Introduction to Statistical Learning with Applications in R” by Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani (Springer, New York, 2013). Le texte est disponible en pdf à l’adresse http://www-bcf.usc.edu/~gareth/ISL/.
Further information:
Les notions de base du logiciel R sont supposées connues. A cette fin, vous pouvez suivre le cours d’introduction à R proposé par FRISAM le vendredi 12 février 2021.
Les participant∙e∙s se muniront d’un ordinateur portable pour utiliser le logiciel (nous contacter si ce n’est pas possible)
Le nombre maximal de participant∙e∙s est 18.
Le coût de la journée de formation est 500 CHF / 400 CHF pour les membres de Swiss Engineering-section Fribourg