Première année
Bloc 1 : septembre - novembre
Probabilités
La théorie des probabilités est au coeur :
de l’analyse des données en ce qu’elle sert de fondement aux statistiques inférentielles, aux statistiques en grandes dimensions
de l’apprentissage machine via notamment les méthodes d’apprentissage statistique et d’apprentissage par renforcement.
Le cours couvre les sujets suivants :
rappels sur la théorie de la mesure et les probabilités élémentaires,
introduction de la notion de vecteurs gaussiens de l’espérance conditionnelle
martingales
chaînes de Markov.
Equations aux Dérivées Partielles (EDP)
Les EDP sont des équations modélisant une grande classe de phénomènes, en mécanique des structures, en mécanique des fluides, en mécanique quantique, en relativité, en physique statistique, en écologie, en sciences sociales ou en finance. La collecte massive de données dans de nombreux champs d’activité et en sciences stimule de nouvelles questions à l’interface modélisation, calcul scientifique et analyse de données. Les EDP jouent un rôle central dans ce triptyque. L’enjeu pour un ingénieur/ingénieur-chercheur de nos jours est de connaître à la fois les techniques classiques de simulation numérique, et les techniques modernes d’apprentissage machine pour les EDP. Ce cours est donc préparatoire aux autres cours en lien avec les EDP. Il couvre notamment : la notion de solutions faibles, l’étude des trois grands types d’EDP linéaires et des exemples d’EDP non linéaires.
Optimisation avancée
Les algorithmes d’optimisation sont omniprésents dans l’industrie, les technologies de la Deeptech et de l’Intelligence Artificielle : calculs de valeurs propres et vecteurs propres, algorithmes de résolution de systèmes linéaires en grandes dimensions et leurs applications à la résolution numérique d’EDP, optimisation des jeux de paramètres dans les réseaux de neurones, résolution de problèmes complexes, souvent mal posés dans l’industrie comme l’optimisation de formes d’ailes d’avion, l’optimisation de réseaux électriques. Le cours couvre les thématiques suivantes :
rappels sur la convexité et la coercivité,
optimisation en dimension finie avec et sans contrainte,
programmation dynamique,
optimisation stochastique.
Réflexion sur l’IA
Le but de ce module est de faire réfléchir les étudiants aux défis posés par l’utilisation massive des données et de l’IA.
Maths/entreprise
Participation à des forums, assiter à des témoignages de différents acteurs du monde industriel, de la Deeptech et de la science.
C++ et Python
Nous apprendrons à maîtriser les langages appropriés à l’étude des données et pour le calcul scientifique en adéquation avec les demandes des entreprises exprimées dans les fiches métier.
Projet
L’étudiant doit être en mesure de compléter son portfolio de compétences. Langages utilisés : C++, Julia, Python ou R, et Visual Basic. Cette UE permettra aussi d’apprendre à utiliser Git.
Bloc 2 : décembre - février
Statistiques avancées
Ce module est centré sur l’analyse statistique inférentielle développée au 20ème siècle . Il n’aborde pas les problématiques liées à l’analyse de données en grandes dimensions qui seront vues en troisième année. Les sujets abordés sont les suivants :
théorèmes limites (lois des grands nombres, TCL, théorèmes de convergence des fonctions de répartition),
statistiques fréquentistes (estimation, tests, intervalles de confiance),
régression linéaire multivariée (modèle linéaire gaussien...),
statistiques bayésiennes,
statistiques non paramétriques (Kolmogorov Smirnov, test du χ2 indépendance et adéquation).
Algèbre linéaire avancée
L’algèbre linéaire appliquée est au coeur notamment des algorithmes des moteurs de recherche, de la théorie des graphes, de la résolution numérique d’équations différentielles et de la classification des données. Un très grand nombre de problèmes se traduit, éventuellement après discrétisation, en des problèmes d’inversion de matrices, de calcul de valeurs propres ou de vecteurs propres de matrices. Ces matrices, bien qu’en très grandes dimensions, ont souvent des structures particulières (matrices positives, matrices creuses) héritées du problème de départ. Ceci résulte en de nombreuses méthodes, basées sur des décompositions matricielles particulières et des outils d’optimisation. Le cours couvre : des rappels de théorie spectrale, la factorisation de matrices, les procédés de Gram- Schmidt et Householder, la décomposition en valeurs singulières, l’analyse en composantes principales, des méthodes itératives de résolution de problèmes linéaires, le calcul approché de valeurs propres, le cas des matrices à coefficients positifs, des matrices primitives, le Théorème de Perron-Frobenius, les algorithmes randomisés.
Introduction à l’apprentissage machine
Ce cours vise à donner les bases de l’apprentissage machine, ou apprentissage automatique, c’est-à-dire l’ensemble des stratégies permettant aux machines d’apprendre à partir de données. De nombreux cours de troisième année aborderont des outils mathématiques de pointe dans cet objectif. Les sujets couverts par le cours d’introduction à l’apprentissage machine sont notamment : des algorithmes classiques d’apprentissage machine, l’approche Bayésienne et les réseaux de neurones.
Méthodes numériques avancées pour les EDP
Les méthodes numériques du calcul scientifique de la révolution informatique continuent à être largement utilisées dans l’industrie. Le but de ce cours est donc de donner aux étudiants la culture du calcul scientifique et la pratique. Le cours couvre la résolution numérique d’équations différentielles : schémas de résolution de problèmes dépendants du temps, différences finies et éléments finis pour les EDP.
Apprentissage de la programmation
Statistiques avec R : Introduction à la programmation avec R, analyse des données
exploratoire, échantillonnage des données, tests d’hypothèse, régression et prédiction,
classification des données.
C++ et Python pour l’analyse des données : Approfondissement des notions présentées au
premier bloc.
Bloc 3 : mars - mai
Analyse harmonique appliquée
Introduction à la transformation de Fourier discrète, à l’échantillonnage, à la notion de filtre/convolution, à la transformée de Fourier à fenêtre glissante, aux ondelettes.
Analyse fonctionnelle avancée
Ce module permet de mettre en place le cadre fonctionnel (définition des espaces et de leurs propriétés) dans lesquels l’analyse des différents problèmes/équations est opérée. Le cours couvre des rappels de topologie, les espaces de Banach et la théorie des opérateurs.
Systèmes dynamiques
Ce module introduit des bases théoriques pour l’étude des systèmes d’équations différentielles non linéaires.
Calcul scientifique
Dans ce module sera abordé un nouveau langage de programmation, Julia, conçu pour le calcul scientifique et le calcul numérique. Nous utiliserons également python.
Stage ou mémoire
Stage en entreprise ou mémoire académique d'une durée de 3 mois.
Deuxième année
Premier semestre : septembre - décembre
Fondements mathématiques de l’apprentissage statistique
Ce module aborde à la fois la problématique de la grande dimension pour l’inférence statistique et introduit des méthodes d’apprentissage statistique. Les sujets couverts sont : la sélection de modèle, les critères convexes, les inégalités de concentration, les modèles graphiques et la classification supervisée.
Transport optimal numérique
La théorie du transport optimal a permis une révolution notamment dans le champ de l’imagerie. Plus récemment, cette théorie s’est développée pour apporter de nouvelles méthodes dans le champ de l’apprentissage et de l’intelligence artificielle. Le but de ce cours est d’explorer cette thématique sous les angles théorique et numérique.
Introduction au calcul quantique
L’objectif de ce cours est d’initier les étudiants au calcul quantique, afin qu’ils soient préparés à faire face à l’émergence des technologies quantiques. Ce cours couvre les bases physiques et axiomatiques de la mécanique quantique, les bases du calcul quantique et de la cryptographie quantique.
Dynamique nonlinéaire, chaos et systèmes complexes
Ce cours se concentre sur les modèles plutôt que les données et explore en particulier les aspects dynamiques des modèles et équations différentielles. Les sujets suivants sont couverts : géométrie des systèmes linéaires et non linéaires, analyse locale, bifurcations, chaos.
Apprentissage machine pour les EDP
Ce module explore les liens entre les données, les modèles et leur dynamique, et le calcul scientifique. Ces liens sont à sens multiples : d’une part les données permettent d’apprendre des modèles, et d’autre part la dynamique des modèles peut renseigner des stratégies d’apprentissage machine. Les sujets couverts sont : l’apprentissage de modèles dynamiques, l’apprentissage machine informé par la physique et la dynamique, l’apprentissage d’opérateurs solutions et son application au calcul scientifique.
C++/python pour l’analyse des données
Approfondissement de la connaissance des langages C++ et Python en adéquation avec les demandes des entreprises exprimées dans les fiches métier.
Réflexion sur l’IA
Le but de ce module est de faire réfléchir les étudiants aux défis posés par l’utilisation massive des données et de l’IA.
Maths/entreprise
Participation à des forums, assiter à des témoignages de différents acteurs du monde industriel, de la Deeptech et de la science.
Second semestre : janvier - avril
Apprentissage géométrique et topologique
Le but de ce cours est d’élaborer des outils pour détecter des structures linéaires et non linéaires dans les données. Un des enjeux est notamment la construction de notions de distances robustes : distance de Wasserstein et homologie persistente.
Processus de décisions markoviens et apprentissage par renforcement
Ce cours explore les mathématiques de l’apprentissage par renforcement qui consiste pour un système à apprendre de ses expériences grâce à des récompenses quantitatives: contrôle optimal, algorithmes de programmation dynamique, processus de décision de Markov.
Statistiques non paramétriques
Ce cours a pour thème l’analyse statistique non paramétrique ne reposant pas sur des familles de lois de probabilités paramétriques. Les sujets abordés sont notamment : l’estimation de fonctions de densité et la régression non paramétrique.
Calcul quantique avancé
Ce cours est le pendant avancé du cours d’introduction au calcul quantique du semestre 1. Les sujets couverts sont : la Simulation de Hamiltoniens quantiques, l’estimation de la phase quantique, l’estimation de l’énergie fondamentale, l’encodage par blocs, les valeurs singulières quantiques et l’apprentissage machine quantique.
Projet de fin d'études
Cette UE s’inscrit dans la pédagogie par projet. L’étudiant doit être en mesure de compléter son portfolio de compétences. Langages utilisés : C++, Julia, Python ou R, et Visual Basic. Cette UE permettra aussi d’apprendre à utiliser Git.
Stage
Stage en entreprise d'une durée de 5 mois. Une soutenance orale permettra l'évaluation.