MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Dit paper introduceert MITRA, een lokaal gehoste RAG-gebaseerde AI-assistent die gebruikmaakt van een geautomatiseerde documentpypeline en een tweelaagse vectordatabase om veilig en nauwkeurig contextbewuste vragen te beantwoorden over fysicanalyses binnen grote wetenschappelijke samenwerkingen zoals CMS.

Abhishikth Mallampalli, Sridhara Dasu

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je werkt in een gigantische, wereldwijde bibliotheek. Deze bibliotheek is zo groot dat er duizenden mensen tegelijk aan werken, en elke seconde worden er nieuwe boeken, notities en blauwdrukken geschreven. Dit is wat er gebeurt bij grote natuurkunde-experimenten, zoals die bij CERN.

Het probleem? De stapel papier is zo hoog geworden, dat zelfs de ervaren bibliothecarissen (de onderzoekers) niet meer weten waar ze moeten zoeken. Als een nieuwe student iets wil weten over een specifieke meting, kan het uren duren om het juiste document te vinden. En als ze het verkeerde boek pakken, kunnen ze de verkeerde conclusies trekken.

Hier komt MITRA om de hoek kijken.

Wat is MITRA?

MITRA is een slimme, digitale assistent (een "vriend", want mitra betekent vriend in het Sanskriet) die is gebouwd om deze chaos te ordenen. Het is geen gewone zoekmachine die alleen zoekt op exacte woorden. Het is een slimme vertaler die begrijpt wat je bedoelt, zelfs als je de woorden niet precies zo gebruikt als in de boeken.

Hoe werkt het? (De Magie in 3 Stappen)

1. De Slimme Verzamelaar (De Robot-Bibliothecaris)
Stel je voor dat MITRA een robot is die 24/7 werkt. Hij gaat naar de interne databases, logt in, en haalt duizenden PDF-bestanden op. Maar hij is niet dom; hij gebruikt een speciale bril (OCR-technologie) om zelfs de moeilijkste tabellen en figuren in de documenten perfect te lezen en te begrijpen. Hij zet alles netjes op een rijtje, klaar voor gebruik.

2. De Twee-Lagen Bibliotheek (De "Voorverkeers" Check)
Dit is het slimste deel. Stel je voor dat je vraagt: "Wat is het grootste gevaar?"

  • In een boek over Higgs-deeltjes is het antwoord misschien "straling".
  • In een boek over donkere materie is het antwoord misschien "ruis in de detector".

Als je een gewone zoekmachine gebruikt, krijgt hij dit door elkaar. MITRA gebruikt een twee-traps systeem:

  • Trap 1: Hij kijkt eerst alleen naar de samenvattingen van alle boeken. Hij vraagt jou: "Bedoel je het boek over Higgs of het boek over donkere materie?" (Dit is een menselijke check om zeker te zijn).
  • Trap 2: Zodra je kiest, "slot" hij zich op in alleen dat ene boek. Alle volgende vragen worden alleen beantwoord op basis van die specifieke context. Zo voorkomt hij dat hij informatie uit het verkeerde boek haalt.

3. De Privé-Denker (Geen Internet Nodig)
Veel slimme AI's werken door je vragen naar een grote server in het buitenland te sturen (zoals naar een fabriek in de VS of China). Dat is duur en kan gevaarlijk zijn voor geheime onderzoeksgegevens.
MITRA doet het anders: Alles gebeurt in huis. De "hersenen" van MITRA zitten op eigen servers binnen het laboratorium. Niemand buiten de groep ziet de vragen of de antwoorden. Het is alsof je een privé-bibliothecaris hebt die in je eigen kelder werkt, in plaats van iemand die je brieven naar een postkantoor stuurt.

Waarom is dit beter dan de oude manier?

De onderzoekers hebben het getest.

  • De oude manier (Zoeken op woorden): Als je vraagt "Hoe hard moet de deeltjesstraal gaan?" en in het boek staat "pT-cut", dan vindt de oude zoekmachine niets. Hij zoekt alleen op exacte woorden.
  • MITRA: Hij begrijpt dat "hard gaan" en "pT-cut" hetzelfde betekenen in de natuurkunde. Hij vindt het juiste antwoord, zelfs als je de vakjargon-woorden niet kent.

Wat is het doel?

Het doel is niet alleen om vragen te beantwoorden, maar om nieuwe onderzoekers sneller te laten starten en ervaren onderzoekers tijd te besparen. In de toekomst wil MITRA nog slimmer worden: hij zou niet alleen antwoorden kunnen geven, maar ook zelf samenvattingen kunnen maken van nieuwe ontdekkingen, of zelfs helpen om fouten in de data te vinden.

Kortom: MITRA is de slimme, discrete, en super-snelle assistent die zorgt dat de enorme berg kennis van de natuurkunde-equipe eindelijk bruikbaar wordt voor iedereen, zonder dat er geheimen lekken of dat je urenlang hoeft te zoeken.