Débute à 
B1007
1375 Avenue Thérèse-Lavoie-Roux
Montréal

Avancées récentes dans l’observation et l’application des techniques d’apprentissage automatique aux études des galaxies et des amas de galaxies

Les galaxies, qui sont des ensembles de milliards d’étoiles, de gaz, de poussière et de matière sombre — un mystère persistant — se répandent à travers l’univers. Il est reconnu que presque toutes les galaxies hébergent un trou noir supermassif capable d’augmenter ou de diminuer le taux de formation stellaire via un mécanisme appelé rétroaction. Les conglomérats massifs de galaxies gravitationnellement liés, nommés amas de galaxies, présentent le même phénomène astronomique, mais à une échelle plus grande. Ces phénomènes laissent des traces dans l’environnement qui sont observables grâce aux instruments contemporains. Cette thèse se concentre sur deux axes principaux : l’application des algorithmes d’apprentissage automatique pour améliorer l’analyse optique des galaxies et des amas de galaxies, ainsi que l’utilisation d’un algorithme spécifique en apprentissage automatique, la machine d’inférence récurrente (MIR), capable de déconvoluer les spectres en rayons X de sources astrophysiques.

Dans la première moitié de cette thèse, nous discutons du développement de LUCI, un logiciel conçu pour ajuster les cubes de données de SITELLE à l’aide de l’apprentissage automatique. Ce logiciel vise à accélérer l’algorithme d’ajustement et à obtenir les meilleurs résultats possibles. SITELLE est un imageur installé sur le télescope Canada-France-Hawaï. Chaque observation capturée par SITELLE produit plus de 4 millions de spectres. LUCI a été développé dans le but de fournir un algorithme d’ajustement polyvalent, personnalisable, facile à utiliser et assisté par l’apprentissage automatique. De plus, LUCI intègre des algorithmes d’ajustement bayésien pour fournir des incertitudes robustes aux utilisateurs. Les deux premiers articles de cette thèse décrivent en détail LUCI et les algorithmes qui le sous-tendent. Après cette présentation, plusieurs projets scientifiques auxquels j’ai contribué sont mis en avant, illustrant l’utilisation de LUCI. Grâce aux innovations apportées par LUCI, nous avons pu étudier plus en détail le gaz ionisé diffus dans des galaxies proches elles que NGC 4449, analyser le gaz ionisé dans une galaxie en chute vers l’amas de Persée, et cartographier en détail le gaz ionisé dans un amas de galaxies à grand décalage vers le rouge (voir section 2.3). Les deux articles suivants, dans les sections 2.4, 2.5, explorent les méthodes d’apprentissage automatique pour effectuer des tâches qui auraient traditionnellement été réalisées par des algorithmes standard : calculer les rapports des lignes d’émission des spectres, démêler les systèmes en fusion et catégoriser les régions d’émission. Dans le premier article, nous développons notre travail antérieur pour construire un algorithme d’apprentissage automatique capable de calculer directement les rapports entre les lignes d’émission à partir d’un spectre de SITELLE. Nous démontrons que malgré ses limites liées à l’ensemble d’entraînement, cette technique est capable d’estimer les rapports avec une plus grande précision que les méthodes traditionnelles. De plus, cette méthode surpasse les autres dans les régions à faible rapport signal-sur-bruit. Dans le deuxième article, section 2.5, nous développons un algorithme d’apprentissage automatique qui détermine le nombre de composantes sous-jacentes dans un spectre de SITELLE. Nous comparons cette méthode à une méthode bayésienne. Nous trouvons que notre méthode réalise la même précision que l’approche bayésienne, mais que celle-dernière prend presque trois ordres de magnitude de plus de temps que la nôtre ; étant donné le vaste nombre de spectres dans une observation SITELLE, cela est très important. Dans le troisième article, section 2.6, nous explorons l’usage des algorithmes d’apprentissage automatique pour classifier les régions d’émissions comme étant soit des restes de supernovae, soit des régions H ii, soit des nébuleuses planétaires, soit des régions de gaz ionisé diffus. Cela nous fournit une méthode indépendante qui peut être utilisée en conjonction avec les techniques traditionnelles. Cette méthode sera intégrée dans le pipeline d’analyse pour la collaboration SIGNALS – un sondage qui étudie près de 50 galaxies proches avec SITELLE.

Dans l’avant-dernier article du chapitre 2, section 2.7, nous développons une nouvelle technique basée sur les algorithmes d’apprentissage automatique qui segmente un cube hyperspectral en régions de source et régions de l’arrière-plan, construit un modèle local de la région à l’arrière-plan, et interpole ce modèle sur les pixels de la source. Nous démontrons l’utilité de cette méthode en l’appliquant à deux observations de SITELLE : NGC 4449, une galaxie irrégulière entourée par une émission diffuse, et NGC 1275, la galaxie centrale de l’amas Persée qui abrite une nébuleuse filamentaire massive. Dans le cas de NGC 4449, cela nous permet de distinguer le gaz ionisé diffus des régions H ii. Dans le dernier article de ce chapitre, nous utilisons LUCI pour analyser les observations de SITELLE de NGC 1275. Cette analyse révèle l’homogénéité du mécanisme d’ionisation dans les filaments étendus. Par ailleurs, cela confirme les résultats précédents selon lesquels il n’y a pas de formation stellaire dans la nébuleuse d’émission, sauf dans deux petites régions.

Dans le troisième chapitre, nous nous concentrons sur les techniques de déconvolution des spectres en rayons X, un objectif qui, jusqu’à présent, reste insaisissable. Cela nous permet, pour la première fois, d’observer le spectre intrinsèque du gaz chaud dans les amas de galaxies. Lorsqu’un spectre en rayons X est observé avec un observatoire en rayons X, le spectre intrinsèque n’est pas directement capturé mais plutôt, il est convolué avec la réponse instrumentale. Dans le cas des observatoires contemporains, cet effet est dramatique car la réponse instrumentale étale les lignes d’émission en une caractéristique simple et elle varie considérablement en fonction du temps et de la position. Les méthodes standard pour extraire les paramètres physiques du spectre utilisent des techniques de pré-ajustement qui augmentent les coûts computationnels et ajoutent des complexités d’ajustement. Par conséquent, une méthodologie de déconvolution des spectres observés peut mener à une modélisation plus précise. C’est avec cela en tête que nous explorons les méthodes de déconvolution des spectres en rayons X, nous donnant ainsi accès aux spectres intrinsèques. Le premier article de ce chapitre, section 3.1, démontre que les techniques traditionnelles de déconvolution ne fonctionnent pas suffisamment pour les spectres complexes, même si elles fonctionnent pour les spectres simples comme les lois de puissance. Dans l’article suivant, nous utilisons un nouvel algorithme d’apprentissage automatique, la MIR, pour effectuer la déconvolution. Dans ce papier, nous montrons le potentiel de cette nouvelle méthode sur des données synthétiques et réelles. Notre MIR entraînée reconstruit le spectre intrinsèque et les réalisations du modèle antérieur avec un niveau de bruit d’un écart-type, démontrant que la MIR est capable, au moins pour les spectres synthétiques, de récupérer les spectres intrinsèques. Dans le dernier article de cette thèse, nous explorons également l’efficacité et les limitations de la MIR dans la déconvolution des spectres en rayons X. La MIR est entraînée sur une base de données synthétique couvrant une gamme plus large de paramètres. Même pour les modèles complexes, la MIR est capable de déconvoluer les spectres synthétiques à un niveau de bruit d’un écart-type. Cependant, lorsqu’elle est appliquée aux données réelles, les reconstructions ne sont pas en accord avec les observations réelles. Cela indique soit que les données synthétiques ne représentent pas fidèlement les observations réelles, soit qu’il y a un problème avec la MIR. Nous concluons cet article en soulignant l’intérêt d’appliquer des modèles de diffusion pour pallier les limitations de la MIR.

Soutenance de doctorat de Carter Rhea