Résumé : With the increasing amount of information needed for diagnosis and therapeutic decision-making, and new trends such as “personalized medicine”, pathologists are expressing an increasing demand for automated tools that perform their most recurrent tasks in their daily practice, as well as an increase in the complexity of the analyses requested in their research activities. With current advances in histopathology, oncology, and biology, the current questions require the analysis of protein expression - evidenced using immunohistochemical (IHC) staining - within specific histological structures or tissue components, or the analysis of the co-expression of several proteins in a large number of tissue samples. In this Ph.D. thesis, we developed innovative solutions to make these analyses available for pathologists. To achieve this objective, we have used recent “machine learning” and, in particular, “deep learning” methodologies. We addressed different problems such as image normalization, to solve the important problem of inter-batch variability of IHC staining, and the automatic segmentation of histological structures, to compartmentalize protein expression quantification. Finally, we adapted image registration techniques to Tissue MicroArray (TMA) slide images to enable large-scale analyses of IHC staining colocalization. While imagenormalization will improve study reproducibility, the tools developed for automated segmentation will drastically reduce time and expert resources required for some studies as well as errors and imprecision due to the human factor. Finally, the work on image registration can provide answers to complex questions that require studying the potential interaction between several proteins on numerous histological samples.
Avec la quantité croissante d’informations nécessaires au diagnostic et à la prise de décision thérapeutique, et le développement de la “médecine personnalisée”, les pathologistes ont un besoin croissant d’outils automatisés pour exécuter leurs tâches les plus récurrentes. Ces outils se doivent également de réaliser des tâches de plus en plus complexes. En effet, avec les progrès récents en histopathologie, oncologie et biologie, les questions actuelles demandent, par exemple, l’analyse de l’expression de protéines révélées par marquages immunohistochimiques (IHC) au sein de structures ou compartiments histologiques spécifiques, ou encore l’analyse de la co-expression de plusieurs protéines dans un grand nombre d’échantillons. Dans cette thèse de doctorat, nous avons développé des solutions innovantes pour mettre ce type d’analyse à la disposition des pathologistes. Pour atteindre cet objectif, nous avons notamment fait appel à des méthodologies récentes de “machine learning” et, particulièrement, de “deep learning”. Nous avons ainsi abordé différentes questions telles que la normalisation d’images, pour résoudre l’important problème de la variabilité des marquages IHC, et la segmentation automatique de structures histologiques, pour permettre une quantification compartimentée de l’expression de protéines. Enfin, nous avons adapté des techniques dites de “recalage” aux images de lames de Tissue MicroArrays (TMA) pour permettre des analyses de colocalisation de marquages IHC à grande échelle. Alors que la normalisation des images améliore la reproductibilité des évaluations de marquages IHC, les outils développés pour la segmentation automatisée permettent de réduire significativement le temps et les ressources expertes nécessaires, ainsi que les erreurs et imprécisions dues au facteur humain. Enfin, les travaux sur le recalages d’images permettent d’apporter des éléments de réponse à des questions complexes qui nécessitent d’étudier l’interaction potentielle entre plusieurs protéines sur de nombreux échantillons histologiques.