ML 1

Apprentissage automatique 1

Description : Ce cours donne le cadre général de l’apprentissage automatique, permettant de situer les différentes approches du domaine. Sont abordés les notions de prétraitement des données, une introduction à la théorie de l’apprentissage statistique (risques, sur-apprentissage, proxys convexes, régularisation), la différence entre approches fréquentistes et bayésiennes, les paradigmes d’apprentissage supervisé, non-supervisé, semi-supervisé, et par renforcement. Quelques approches sont détaillées (méthodes à Noyaux, SVM, Boosting, Bagging, Arbres de décision…).

Acquis d’apprentissage : À l’issue de ce cours, les élèves sauront reconnaître dans le paysage des nombreuses méthodes disponibles sur l’étagère les différentes classes d’algorithmes. Ils auront de plus les notions statistiques qui leur permettront un usage raisonné de ces méthodes, évitant ainsi une approche boîte noir avec essai des paramètres à l’aveugle.

Moyens : Les cours et travaux de pratiques sont donnés par Hervé Frezza-Buet, Arthur Hoarau, Jérémy Fix. Les cours présentent les aspects théoriques, des preuves mathématiques, mais sont également illustrés par des démonstrations des algorithmes. Les travaux pratiques s’effectueront en python, en utilisant sickit-learn, en binômes.

Modalités d’évaluation : Examen écrit de 2h, rattrapable.

Compétences évaluées :

  • Analyser, concevoir et réaliser des systèmes complexes
  • Développer ses compétences dans un domaine d’ingénieur et dans un métiers

Responsable de cours : Hervé Frezza-Buet

Identifiant Geode : 3MD1540


CM :

  1. Datasets and learning (1.5 h)
  2. Frequentist, Bayesian, evaluation (1.5 h)
  3. Risks (1.5 h)
  4. C-SVC, Lagrange formulation (1.5 h)
  5. Kernels, numerical resolution (1.5 h)
  6. SVMs for regression, unsupervized learning, nu-versions of SVMs. (1.5 h)
  7. Arbres de décision (1.5 h)
  8. Bagging (1.5 h)
  9. Boosting (1.5 h)

TP :

  1. Data Science en Python (3.0 h)
  2. Arbres de décision (3.0 h)
  3. Bagging (3.0 h)
  4. Forêts aléatoires (3.0 h)