Relating Reinforcement Learning to Dynamic Programming-Based Planning

Dit artikel overbrugt de kloof tussen dynamisch programmeren en versterkend leren door een gedeterminiseerde versie van versterkend leren te ontwikkelen en wiskundig te analyseren om de equivalentie tussen kostenminimalisatie en beloningsmaximalisatie te tonen, terwijl het pleit voor het optimaliseren van de werkelijke kosten in plaats van het gebruik van willekeurige parameters.

Filip V. Georgiev, Kalle G. Timperi, Basak Sakçak, Steven M. LaValle2026-03-10💻 cs

The Theory and Practice of Computing the Bus-Factor

Dit artikel introduceert een unificerend, domein-onafhankelijk raamwerk voor het berekenen van de bus-factor door projecten als bipartiete grafen te modelleren, bewijst dat zowel de exacte berekening als de geïntroduceerde robuustheidsgebaseerde maatstaf NP-moeilijk zijn, en presenteert efficiënte lineaire benaderingsalgoritmen die projectrisico's informatiever en stabieler inschatten dan bestaande methoden.

Sebastiano A. Piccolo, Pasquale De Meo, Giorgio Terracina, Gianluigi Greco2026-03-10💻 cs

Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy

Deze paper introduceert een taakbewuste interface die visuele input omzet in een semantisch-geometrische representatie door objecten te segmenteren en te herverven met vooraf gedefinieerde kleuren en dieptedata, waardoor robotbeleid robuuster wordt tegen visuele veranderingen zonder het beleid zelf aan te passen.

Haoran Ding, Liang Ma, Yaxun Yang, Wen Yang, Tianyu Liu, Anqing Duan, Xiaodan Liang, Dezhen Song, Ivan Laptev, Yoshihiko Nakamura2026-03-10💻 cs

RoboRouter: Training-Free Policy Routing for Robotic Manipulation

Het artikel introduceert RoboRouter, een trainingsvrij kader dat de prestaties van robotmanipulatie verbetert door een pool van heterogene beleidsmodellen intelligent te routeren op basis van semantische taakrepresentaties en historische uitvoeringsgegevens, wat resulteert in aanzienlijk hogere succespercentages dan individuele beleidsmodellen.

Yiteng Chen, Zhe Cao, Hongjia Ren, Chenjie Yang, Wenbo Li, Shiyi Wang, Yemin Wang, Li Zhang, Yanming Shao, Zhenjun Zhao, Huiping Zhuang, Qingyao Wu2026-03-10💻 cs

EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records

Het artikel introduceert EveryQuery, een EHR-fundatiemodel dat via task-geconditioneerd pre-training zero-shot klinische voorspellingen mogelijk maakt door direct de waarschijnlijkheid van een uitkomst te schatten op basis van een patiëntgeschiedenis en een gestructureerde query, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van autoregressieve baselines, met name voor zeldzame klinische gebeurtenissen.

Payal Chandak, Gregory Kondas, Isaac Kohane, Matthew McDermott2026-03-10💻 cs