Le stage proposé par la Direction des Applications Militaires du CEA, en Île-de-France, explore une approche de similarité des modèles génératifs de diffusion. Après la construction d’un espace latent via un embedding, le travail portera sur un modèle de diffusion latent et son évaluation sur un problème inverse, avec des tests MNIST. Le candidat idéal maîtrise Python et PyTorch, dispose d’une formation en mathématiques appliquées et IA et est diplômé Bac+5. Une expérience avec les réseaux convolutionnels ou diffusion est un plus. Stage de 6 mois, début ASAP; inclusion et enquête administrative nécessaires pour les postes sensibles. Conseils: mettez en avant vos projets concrets et vos réalisations Python PyTorch, et votre capacité à travailler en équipe.
Mathématiques, information scientifique, logiciel
Stage
Stage - Bac+5 - Organiser par similarité des images générées par IA - H/F
De nombreux traitements/analyses d’expériences réalisés au sein de la Direction des applications militaires du CEA peuvent être formulés comme des problèmes inverses mal posés. Il s’agit de problèmes dont les solutions sont multiples et/ou très sensibles à de petites variations dans les données expérimentales en entrée (p. ex. au bruit de mesure). Il est ainsi nécessaire d’injecter un a priori sur la solution pour contraindre l’espace de recherche et donc la résolution du problème. La progression fulgurante des performances des méthodes par apprentissage profond offre de ce point de vue une opportunité incontournable. Il n’est cependant pas trivial a posteriori de déterminer où se situe la solution générée par rapport à la base d’apprentissage du modèle (p. ex. ses plus proches voisins ou son appartenance à une classe d’objet). Cette information est pourtant essentielle pour discriminer des hypothèses physiques ou se rattacher à des expériences connues.
Césure ou 6 mois
Le stage aura pour objectif de tester la faisabilité d'une approche par similarité sur des modèles génératifs dits de diffusion [1]. Plus particulièrement, l’axe de recherche privilégié est d’opérer l’évaluation dans un espace latent en utilisant un plongement (« embedding ») judicieux [2]. Après cette première étape de construction d’un espace latent, une seconde phase consistera à utiliser un modèle de diffusion latent sur cette base [3]. Enfin, la pertinence de l’approche pourra être évaluée sur un problème inverse à déterminer [4]. Le(la) stagiaire aura l’occasion d’implémenter l’ensemble de ses évaluations sur la base de données académique MNIST.
L'unité accueillant ce stage est en charge du développement et de l’amélioration continue des outils de traitement des diagnostics expérimentaux. L’ensemble des développements s’effectuera en Python. Une bonne maîtrise du langage est donc nécessaire, et la connaissance de librairies telles que PyTorch sera appréciée. Le(la) stagiaire devra également avoir une solide formation en mathématiques appliquées et en intelligence artificielle. La mise en œuvre d’outils d’apprentissage statistique sur des images, et en particulier une expérience préalable avec les réseaux convolutionnels/modèles de diffusion, serait un plus. Le stage d’une durée de 6 mois est à pourvoir dès que possible.
1. Ho et al., Denoising Diffusion Probabilistic Models, NeurIPS 2020
2. Wang et al., Understanding Contrastive Representation Learning through Alignment and uniformity on the Hypersphere, ICML 2020
3. Rombach et al., High-Resolution Image Synthesis With Latent Diffusion Models, CVPR 2022
4. Chung et al., Diffusion Posterior Sampling for General Noisy Inverse Problems, ICLR 2023
Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes handicapées, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation pour l’inclusion des travailleurs handicapés.
Participant à la protection nationale, une enquête administrative est réalisée pour tous les collaborateurs du CEA afin d'assurer l'intégrité et la sécurité de la nation.
Python, PyTorch, Mathématiques Appliquées
Bac+5
DAM Île-de-France
France, Ile-de-France