Synthetic Monitoring Environments for Reinforcement Learning

Die Arbeit stellt „Synthetic Monitoring Environments" (SMEs) als eine unendliche Suite konfigurierbarer, kontinuierlicher Steuerungsaufgaben mit bekannten optimalen Strategien vor, die es ermöglichen, Reinforcement-Learning-Algorithmen durch präzise, white-box-Diagnosen und exakte Regret-Berechnungen systematisch zu analysieren und von empirischem Benchmarking zu einer rigorosen wissenschaftlichen Evaluation zu überführen.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Die vorgestellte Arbeit stellt DeCoST vor, einen lernbasierten zweistufigen Ansatz zur Entkopplung diskreter und kontinuierlicher Entscheidungsvariablen beim Orientierungsproblem mit Zeitfenstern und variablen Gewinnen, der durch eine parallele Pfadvorhersage und eine nachgelagerte lineare Optimierung sowohl die Lösungsqualität als auch die Recheneffizienz im Vergleich zu bestehenden Methoden signifikant verbessert.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Die Studie zeigt, dass agentic retrieval-augmented Reasoning-Pipelines in der Radiologie-Fragebeantwortung die Konsistenz und Robustheit über verschiedene Large Language Models hinweg erhöhen, obwohl eine hohe Übereinstimmung nicht automatisch Korrektheit garantiert und viele Fehler klinisch schwerwiegend sein können.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

Die Arbeit stellt GMM-PIELM vor, einen probabilistischen adaptiven Sampling-Ansatz, der die Genauigkeit und Konditionierung von Physics-Informed Extreme Learning Machines für steife PDEs mit scharfen Gradienten drastisch verbessert, indem er Radial-Basis-Funktionszentren autonom in Regionen mit hohem numerischem Fehler konzentriert, ohne dabei auf kostenintensive gradientenbasierte Optimierungen angewiesen zu sein.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Die vorgestellte Arbeit schlägt eine Methode zur Entfernung von Artefakten in 3D-CBCT-Bildern vor, die auf senkrechten score-basierten Diffusionsmodellen im Projektionsbereich basiert und durch die Kombination zweier 2D-Modelle die Konsistenz zwischen den einzelnen Projektionen verbessert.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Diese Arbeit stellt PolaDCA vor, ein neuartiges Framework für die Fehlerdiagnose rotierender Maschinen, das mithilfe eines polarisierten direkten Kreuz-Aufmerksamkeitsmechanismus datengesteuerte Graphen und adaptive Nachrichtenweitergabe ermöglicht, um die Robustheit gegenüber Rauschen und die Diagnosegenauigkeit im Vergleich zu herkömmlichen Graph-Neural-Networks signifikant zu verbessern.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

Diese Arbeit stellt eine dreistufige Pipeline vor, die Sprachmodelle durch die Berechnung feinabgestimmter Entropie-Scores, deren Kalibrierung mittels Platt-Skalierung und anschließendes Reinforcement Learning trainiert, um effiziente, gut kalibrierte und interpretierbare Unsicherheitsschätzungen für ihre Antworten zu generieren.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Die Arbeit stellt SAHOO vor, ein praktisches Framework, das durch einen gelernten Zielabweichungsindex, die Durchsetzung sicherheitskritischer Invarianten und die Quantifizierung von Regressionsrisiken die Ausrichtungsdrift während des rekursiven Selbstverbesserungsprozesses überwacht und kontrolliert, um signifikante Qualitätssteigerungen bei gleichzeitiger Wahrung von Sicherheitsgrenzen zu ermöglichen.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Die Studie stellt AIRT vor, ein tiefes Lernframework, das innerhalb einer Sekunde auf einer einzigen GPU direkt aus CT-Bildern und Konturen strahlentherapeutische Behandlungspläne für Prostatakrebs generiert und dabei eine Qualität aufweist, die mit dem etablierten RapidPlan Eclipse vergleichbar ist.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

Das Paper stellt den Dynamic Chunking Diffusion Transformer (DC-DiT) vor, der durch einen lernbasierten Encoder-Router-Decoder adaptiv und datenabhängig die Anzahl der Tokens je nach Bildinhalt und Diffusionszeitpunkt optimiert, um die Recheneffizienz zu steigern und gleichzeitig die Bildqualität im Vergleich zu herkömmlichen DiT-Modellen zu verbessern.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

Dieses Paper stellt CLAIRE vor, ein hybrides Deep-Learning-Framework für die intelligente Qualitätskontrolle in der Fertigung, das durch einen optimierten Autoencoder komprimierte latente Repräsentationen erzeugt und mit einer spieltheoretischen Interpretierbarkeitstechnik eine robuste und erklärbare Fehlererkennung in hochdimensionalen Umgebungen ermöglicht.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

Diese Arbeit stellt ein Schema-gated Orchestrierungs-Modell vor, das durch die Trennung von konversationeller Flexibilität und deterministischer Ausführung den Zielkonflikt zwischen natürlichsprachlicher Interaktion und reproduzierbaren wissenschaftlichen Workflows löst.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI