Valérie de LapparentDirectrice de recherche |
![]() d'Astrophysique de Paris |
![]() |
![]() |
|
98 bis Boulevard Arago
75014 Paris France |
Autres sujets de stage de Master 2 (2021) |
Il s'agit de déterminer par apprentissage supervisé les types et autres caractéristiques morphologiques d'un nouveau catalogue de galaxies proches, MorCat. Il est extrait du grand relevé du ciel « Sloan Digital Sky Survey » (SDSS), basé sur de multiples balayages par caméra CCD du ciel dans 5 filtres (ugriz). Le relevé fournit des images bien résolues des galaxies proches permettant la mesure précise de leur flux et de leur morphologie. Le catalogue MorCat contient les ~20 000 galaxies les plus brillantes (g≤15.5 ; exemple galaxie PGC 635) de la calotte polaire de l’hémisphère nord galactique.
Les réseaux sont constitués de couches multiples de convolution inspirées des modules du réseau Inception (utilise par Google pour la reconnaissance de forme dans les images ; Szegedy et al. 2014) puis de couches complètement connectées, et d'une couche finale de « Softmax ». Les réseaux ont été entrainés sur le catalogue étiqueté par morphologie visuelle détaillée EFIGI : il s'agit d'un sous-échantillon incomplet de 4458 galaxies du catalogue MorCat ayant fait l'objet d'un travail extensif de morphologie visuelle (voir des images des galaxies pages 9 à 16 dans Baillard et al. 2011 ; de Lapparent et al. 2011).
Les réseaux existants et les outils de diagnostic seront à la disposition du/de la stagiaire (codes Python + TensorFlow). L'architecture du réseau pourra etre modifiée en vue d'optimiser sa sensibilité aux caractéristiques morphologiques recherchées, et celui-ci ré-entrainé sur EFIGI, permettant ainsi à l'étudiant de se former aux techniques d'apprentissage profond appliquées à des images.
Les étapes à mettre en œuvre lors du stage sont l'enrichissement de la base d'entraînement par augmentation de données (en perturbant les images par rotation, miroir, changement de résolution), ainsi que la modification des réseaux afin de les rendre invariants par rotation des images (Dieleman et al. 2015). Des échantillons d'images simulées de galaxies seront également disponibles pour tester les performances des réseaux.
Les mesures de type morphologique de MorCat pourront être ensuite comparées aux types de Hubble dans la base de données HyperLeda (toutes les galaxies de MorCat y sont répertoriées). Ceux-ci ont souvent été déterminés à partir de plaques photographiques ayant une moins bonne résolution que les images CCD (galaxie PGC 635 dans le SDSS), et des problèmes de non linéarité et d'intervalle dynamique réduit (exemple : plaque).
La connaissance de la morphologie pour l'ensemble du catalogue MorCat rendra possible des analyses statistiques sans précédent concernant les galaxies proches : fonctions de luminosité et de masse par type, corrélations spatiales par type, répartition des types au sein de la toile cosmique.
Références
Dernière mise à jour : 14/10/2019
Figures : exemple de réseau utilisé pour EFIGI (haut), matrice de confusion sur les types de Hubble (bas gauche), et évolution du taux d'erreur et de la fonction de coût pendant un apprentissage (bas droite).
Figures : exemples de galaxies EFIGI avec différents types morphologiques, sur lesquels est effectué l'apprentissage ci-dessus.