CHAMMI-75: Pre-training multi-channel models with heterogeneous microscopy images

Ce papier présente CHAMMI-75, un jeu de données ouvert de 75 études biologiques hétérogènes en microscopie multicanal, conçu pour entraîner des modèles adaptatifs capables de quantifier la morphologie cellulaire sur n'importe quel type d'image microscopique.

Vidit Agrawal, John Peters, Tyler N. Thompson, Mohammad Vali Sanian, Chau Pham, Nikita Moshkov, Arshad Kazi, Aditya Pillai, Jack Freeman, Byunguk Kang, Samouil L. Farhi, Ernest Fraenkel, Ron Stewart, Lassi Paavolainen, Bryan A. Plummer, Juan C. Caicedo

Publié 2026-03-04
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous essayez d'apprendre à un robot à reconnaître des cellules humaines en regardant des microscopes. Jusqu'à présent, c'était comme si chaque robot n'apprenait qu'avec un seul type de lunettes.

Si un robot apprenait avec des lunettes qui ne voient que le noyau de la cellule, il devenait très fort pour ça, mais s'il devait regarder une cellule avec des lunettes qui voient aussi les mitochondries ou l'ADN, il était perdu. Il fallait créer un nouveau robot pour chaque type de microscope, ce qui était lent, coûteux et inefficace.

Voici ce que l'équipe de chercheurs a fait avec CHAMMI-75 :

1. La Grande Bibliothèque de Cellules (CHAMMI-75)

Imaginez que vous avez une bibliothèque immense, mais au lieu de livres, elle contient 2,8 millions d'images de cellules provenant de 75 études scientifiques différentes à travers le monde.

  • Le problème : Ces images sont très hétérogènes. Certaines ont 2 couleurs (canaux), d'autres en ont 14 ! Certaines sont prises avec un microscope puissant, d'autres avec un modèle plus simple. C'est le chaos total, comme un tas de pièces de Lego de toutes les couleurs et de toutes les formes.
  • La solution : Les chercheurs ont nettoyé, trié et organisé ce tas de pièces pour créer une ressource unique. C'est comme si on prenait des milliers de recettes de cuisine du monde entier, avec des ingrédients différents, et qu'on les mettait dans un seul livre de cuisine géant.

2. Le Robot Polyglotte (MorphEm)

Grâce à cette bibliothèque géante, ils ont entraîné un nouveau modèle d'intelligence artificielle qu'ils appellent MorphEm.

  • L'analogie : Avant, un robot était comme un musicien qui ne savait jouer que la flûte. S'il devait jouer du violon, il ne savait pas faire.
  • Avec CHAMMI-75 : MorphEm est devenu un orchestre complet. Peu importe le nombre de "couleurs" (canaux) que l'image a, peu importe le microscope utilisé, le robot sait s'adapter. Il peut regarder une image avec 2 couleurs, puis une autre avec 10, et comprendre la forme de la cellule dans les deux cas.

3. Pourquoi c'est révolutionnaire ?

Dans le passé, si un laboratoire changeait de microscope ou ajoutait un nouveau test chimique, il fallait tout recommencer de zéro.

  • L'analogie du voyageur : Imaginez un voyageur qui a appris à conduire uniquement sur des routes de montagne en hiver. S'il arrive en été sur une route de plage, il panique.
  • Le voyageur avec CHAMMI-75 : Ce voyageur a conduit sur des routes de montagne, de plage, dans la neige, sous la pluie, avec des camions, des motos et des vélos. Quand il arrive sur une nouvelle route, il sait exactement comment conduire, peu importe les conditions.

4. Les Résultats

Les chercheurs ont testé ce robot sur des tâches difficiles :

  • Reconnaître des maladies : Il arrive à distinguer des cellules saines de cellules malades, même si l'image est prise avec un microscope qu'il n'a jamais vu auparavant.
  • Généralisation : Il fonctionne aussi bien sur des cellules humaines que sur des cellules de souris, ou même sur des globules rouges, sans avoir besoin d'être réentraîné.

En résumé

Cette recherche, présentée à la conférence ICLR 2026, c'est comme passer de l'apprentissage par cœur (mémoriser une seule image) à l'apprentissage par la compréhension (comprendre la biologie de la cellule, peu importe comment on la regarde).

Ils ont créé la plus grande "boîte à outils" d'images de cellules jamais vue, permettant de construire des intelligences artificielles qui sont enfin capables de comprendre la vie microscopique dans toute sa diversité, sans être bloquées par les limites techniques des appareils photo. C'est une étape majeure pour accélérer la découverte de nouveaux médicaments et comprendre comment nos cellules réagissent aux traitements.