Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Cet article propose un cadre d'ordonnancement adaptatif pour les cliniques externes qui intègre la prédiction individualisée des absences et un apprentissage par renforcement multi-objectifs pour optimiser dynamiquement les décisions de réservation simple, double ou de refus, tout en assurant l'interprétabilité des modèles.

Ninda Nurseha Amalina, Heungjo An

Publié 2026-03-10
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

🏥 Le Problème : Le "Téléphone Arabe" des Rendez-vous Médicaux

Imaginez une salle d'attente de médecin. C'est un peu comme un restaurant très populaire. Le problème, c'est que certains clients réservent une table (un rendez-vous) mais ne viennent jamais. C'est ce qu'on appelle un "no-show" (non-présentation).

  • Le résultat ? Le médecin reste assis à ne rien faire, perdant du temps et de l'argent.
  • La solution habituelle ? Les cliniques font de la "sur-réservation" (comme les compagnies aériennes). Elles essaient de mettre deux patients sur le même créneau horaire, au cas où l'un des deux n'arrive pas. C'est ce qu'on appelle le double-bookings.

Mais attention ! Si tout le monde arrive, c'est la catastrophe : la salle d'attente devient une fourmilière, les gens attendent des heures, et le médecin est débordé. C'est comme essayer de faire entrer deux voitures dans une seule place de parking : ça marche si l'une d'elles est absente, mais si elles sont toutes les deux là, c'est le bouchon total.

🤖 La Solution : Un "Chef d'Orchestre" Intelligent

Les chercheurs de cette étude (Ninda Nurseha Amalina et Heungjo An) ont créé un système intelligent pour résoudre ce casse-tête. Au lieu d'utiliser des règles fixes du type "Si le patient a plus de 50 ans, on le double-réserve", ils ont créé un cerveau artificiel qui apprend en temps réel.

Voici comment ça marche, étape par étape, avec des analogies :

1. Le Détective (Prédiction des absents)

Avant même de prendre une décision, le système utilise un détective très fin nommé MHASRF. Ce détective analyse des centaines de détails sur le patient (son âge, sa langue, la météo du jour, son historique de rendez-vous, etc.) pour deviner : "Quelle est la probabilité que ce patient ne vienne pas ?".

  • Analogie : C'est comme un météorologue qui ne vous dit pas juste "il va pleuvoir", mais qui vous dit "il y a 80% de chance de pluie pour vous, mais seulement 10% pour votre voisin".

2. Le Chef d'Orchestre (L'Intelligence Artificielle)

Une fois que le système connaît le risque d'absence, il doit décider quoi faire. Il a trois options pour chaque demande de rendez-vous :

  1. Single-book : Mettre une seule personne sur le créneau (sécurité maximale).
  2. Double-book : Mettre deux personnes sur le même créneau (risque de bouchon, mais pas de temps perdu).
  3. Rejeter : Dire "désolé, c'est complet".

Pour faire ce choix, le système utilise une technique appelée Apprentissage par Renforcement Multi-Objectif.

  • Analogie : Imaginez un chef d'orchestre qui doit équilibrer trois instruments en même temps :
    • L'instrument Utilisation (ne pas laisser le médecin inactif).
    • L'instrument Sécurité (éviter que deux patients n'arrivent en même temps).
    • L'instrument Équilibre (que le nombre de patients attendus corresponde exactement à la capacité de la salle).

Le chef d'orchestre apprend par essais et erreurs (comme un enfant qui apprend à faire du vélo) pour trouver le rythme parfait.

3. L'Équipe de Coureurs (L'Algorithme MPPPO)

Au lieu d'entraîner un seul chef d'orchestre, ils en entraînent dix en même temps, chacun avec une priorité légèrement différente.

  • L'un est très prudent (il évite à tout prix les bouchons).
  • L'autre est très ambitieux (il veut remplir la salle à ras bord).
  • Un troisième cherche le compromis parfait.

Ils s'entraînent ensemble et s'échangent des astuces. Si l'un découvre une bonne technique pour éviter les bouchons, il la partage avec les autres qui sont "proches" de lui dans leur façon de penser. C'est comme une équipe de coureurs de relais qui se passent le témoin pour aller plus vite.

🌟 Les Résultats : Pourquoi c'est génial ?

Lorsqu'ils ont testé ce système sur de vraies données de cliniques :

  • Moins de temps perdu : Les médecins sont moins souvent assis à rien faire.
  • Moins de bouchons : Le système évite intelligemment de mettre deux patients risqués sur le même créneau.
  • Plus de flexibilité : Contrairement aux règles fixes d'avant, ce système s'adapte. Si la météo change ou si les patients deviennent plus imprévisibles, le système s'adapte instantanément.

🧠 En Résumé

Imaginez que vous gérez un parking de 10 places.

  • L'ancienne méthode : Vous mettez 12 voitures, espérant que 2 ne viendront pas. Si elles viennent toutes, c'est le chaos.
  • La nouvelle méthode (ce papier) : Vous avez un gardien intelligent qui regarde chaque chauffeur. S'il voit un chauffeur qui a l'air pressé et fiable, il lui donne une place. S'il voit un chauffeur qui a l'habitude d'arriver en retard ou de ne pas venir, il lui dit : "Allez, je vous mets deux places à côté, au cas où l'autre ne vient pas".

Ce système apprend à trouver le juste milieu entre ne pas gaspiller de temps et ne pas créer de foule. C'est une victoire pour les médecins (qui travaillent mieux) et pour les patients (qui attendent moins).