3e séminaire du doctorat en informatique cognitive pour la session hiver 2020
Conférencier:
Dr Ahmed Halioui est un diplômé au doctorat en informatique cognitive de l’UQAM. Sa thèse intitulée « Extraction de flux de travaux abstraits à partir des textes : application à la bioinformatique » était sous la direction de M. Abdoulaye B. Diallo et Petko Valtchev. Il travaille maintenant à My Intelligent Machines (MIMs) – une start-up intégrant la Génomique, la Bioinformatique et l’Intelligence Artificielle – en tant que scientifique de données. Ses champs d’intérêts portent sur les ontologies, la fouille de donnée, l’extraction de l’information et la bioinformatique.
Résumé
Dans des domaines techniques comme la bioinformatique, l’acquisition des connaissances impliquées dans le processus de résolution de problèmes (e.g. flux de travaux) est sujet de plusieurs défis liés à la fois aux données et aux outils utilisés ainsi qu’à la représentation de son domaine d’application, e.g., en analyse phylogénétique. Des motifs de processus généralisés (abstraits) serviront ainsi de guider davantage une construction interactive des tâches de résolution de problèmes. Ici, l’espace de motifs généralisé est irrégulier cas il est induit par un schéma de processus – lui-même tiré d’une ontologie de domaine – avec des hiérarchies dédiées aux composants de processus (tâches, paramètres, contraintes sur les données, etc) et les interactions entre ces composants.
Bien que les structures des flux de travaux soient des DAG (graphes orientés acycliques), nous montrons que notre problème pourrait être représenté par un espace de motifs séquentiels généralisés avec des liens étiquetés entre les éléments. Nous définissons dans ce travail la tâche d’exploration de l’espace et proposons une méthode de recherche en profondeur d’abord en utilisant uniquement un ensemble d’opérations primitives de raffinement exploitant la structure de l’ontologie. De plus, les hiérarchies de composants sont correctement indexées pour fournir un ordre total entre les composants des modèles qui permet une exploration exhaustive mais non redondante de l’espace de motifs. Une évaluation basée sur des recommandations indiquent que notre méthode se comporte d’une façon satisfaisante en termes d’efficacité et de précision prédictives.