Résumé : Cette thèse en bioinformatique a été réalisée entre 2010 et 2015 dans le groupe du Pr. Vincent Detours à l’Institut de Recherche Interdisciplinaire en Biologie Humaine et Moléculaire. Nous avons analysé des données génomiques et transcriptomiques provenant de carcinomes papillaires de la thyroïde (CPTs) et leurs tissus non-cancéreux adjacents. La première partie étudiait les différences transcriptomiques entre CPTs post-Tchernobyl et CPTs sporadiques, et leur tissus non-cancéreux adjacents. Dans notre cohorte, les cas sporadiques étaient en moyenne et significativement un an plus jeunes. Après un ajustement des données transcriptionnelles pour l'âge, près de 400 gènes étaient plus exprimés dans les tissus adjacents des patients exposés aux radiations. Cependant, nous n’avons pu détecter aucune surreprésentation de groupe de gènes participant à des fonctions biologiques connues. Il était possible de distinguer les cas sporadiques des cas post-Tchernobyl sur base des transcriptomes de leurs tissus adjacents, avec une précision de ~70%. Cette surexpression de gènes dans les tissus non-cancéreux adjacents pourrait être liée à une radiosensibilité accrue dans le groupe des patients exposés aux radiations de Tchernobyl. Dans la deuxième étude, nous avons intégré des données provenant des patients de la première partie, incluant les nombres de copies d'ADN des CPTs, le génotype de plus de 400.000 SNPs dans le sang et les données transcriptionnelles des CPTs et leurs tissus non-cancéreux adjacents. En reproduisant les résultats d'une étude précédente, nous avons retrouvé la région 7q11.23 dupliquée exclusivement dans un tiers des patients exposés aux radiations. Dans une étude indépendante, un autre groupe a montré que la duplication de cette région était plus fréquente dans une population de lignées cellulaires radiosensibles que dans la population humaine normale. Cependant, en analysant les transcriptomes des patients présentant cette duplication, nous n'avons pas détecté de différence d’expression des gènes codés dans cette région génomique. En outre, aucun génotype de SNP n'était significativement lié à l'exposition aux radiations. En conclusion, les résultats confirment qu'un tiers des CPTs post-Tchernobyl ont des traces d'un dégât radio-sensibilsant dans leur ADN. Dans une troisième étude, nous avons étudié les différences transcriptionnelles entre CPTs et leurs métastases ganglionnaires (MGs) associées, ainsi qu'entre des CPTs développant des MGs (N+) et des CPTs ne développant pas de MGs (N0). Des études précédentes comparant les MGs et leurs tumeurs associées impliquant d’autres organes ont montré une surexpression de gènes dans les MGs, liés aux cellules immunitaires. Ce signal provient du tissu contaminant environnant les MGs. Pour se défaire de ce signal contaminant, d’autres études ont microdisséqué au laser les parties tumorales des MGs. Cependant, la microdissection retire aussi le stroma associé à la tumeur, alors que celui-ci est justement impliqué dans la progression tumorale. Grâce à une méthode originale, nous avons corrigé nos données d’expression des MGs pour leur contenu en contaminant ganglionnaire non-cancéreux. Après cette correction, l’expression de gènes liés au stroma était plus élevée dans les MGs que dans leurs CPTs. Les différences d’expression entre N0 et N+ n’étaient pas reproductibles entre 4 jeux de données indépendants de CPTs. Ceci démontre l’absence d’un signal transcriptionnelle lié au statut nodal dans ces données. Cependant, en utilisant des données publiques comprenant des centaines de tumeurs, il est possible de prédire le statut nodal (N0 ou N+) des CPTs ainsi que des cancers du sein et du colon à partir de leurs transcriptomes. Des études précédentes montraient des taux de prédiction presque parfaits (>90%) du statut nodal à partir des données transcriptomiques. Nous avons décelés dans ces études le même biais technique de sélection des gènes, qui peut expliquer ces taux artificiellement élevés. Dans notre étude, ce biais n’était pas présent et la précision de nos prédictions était limitée (<70%), questionnant l’intérêt clinique de telles prédictions. La présence d’un signal permettant de prédire le statut nodal et l’irreproductibilité de ce signal dans des jeux de données indépendants peuvent s'expliquer par l’association entre le statut nodal et des caractéristiques d'agressivité des tumeurs, qui pourraient, elles, avoir une influence reproductible sur les transcriptomes. Dans notre dernière étude, nous avons analysé les différences entre CPTs, liées à la présence de BRAFV600E, une mutation commune à 60% des CPTs. En utilisant un jeu de données public, nous avons montré que les CPTs présentant la mutation étaient plus dédifférenciés, et plus infiltrés en stroma, probablement en lymphocytes et fibroblastes; et que ces CPTs présentaient plus de fibrose et proliféraient sans doute plus. Tout ceci suggère que les CPTs mutés pour BRAF constituent un groupe de CPTs plus agressif. Des caractéristiques d’agressivité pourraient être détectées au front invasif, c’est-à-dire la périphérie de la tumeur définissant son contact avec le stroma, notamment la présence de regroupement de cellules isolées du reste de la tumeur. Dans les CPTs, ces îlots cellulaires isolés sont observés sur des lames histologiques 2D et pourraient être expliqués soit par un détachement cellulaire, signe d’agressivité lié au processus métastatique, soit une conformation complexe compatible avec une tumeur connexe en 3D. Dans un CPT, nous avons analysé la conformation 3D du front invasif d'un CPT muté. Nous avons reconstruit son volume 3D grâce à une méthode originale. Les groupes de cellules cancéreuses qui semblaient isolées sur les images 2D d’histopathologie, étaient en fait connectés en 3D. L’hypothèse de la présence de détachement cellulaire suite à la transition épithélio-mésenchymateuse n’est donc pas requise pour expliquer la présence de ces îlots cellulaires en 2D. La forme 3D du front invasif impliquait une surface de contact entre tumeur et stroma bien plus importante qu'impliquée par la forme ellipsoïde habituellement décrite. Les fibroblastes participaient autant à la création de la masse tumorale que les cellules cancéreuses, puisque ces deux groupes de cellules proliféraient à la même vitesse. A l'avenir, le séquençage du matériel génétique de cellules individuelles facilitera notre interprétation des signaux génomiques et transcriptomiques, qui jusqu’alors provenaient de tissu complet, i.e. un mélange de populations de cellules tumorales, stromales et de contaminant. Une signature de radiation pourrait être extraite des profils mutationnels de cellules individuelles exposées aux radiations et à l’H2O2 in vitro et comparée à la signature des CTPs post-Tchernobyl. Les cellules tumorales et stromales individuelles des MGs pourraient être comparées aux cellules tumorales et stromales invividuelles des CPTs. De même les cellules individuelles mutées pour BRAFV600E pourraient être comparées aux cellules non mutées.