On Sample-Efficient Generalized Planning via Learned Transition Models

Questo lavoro propone un approccio di pianificazione generalizzata basato sull'apprendimento esplicito di modelli di transizione neurali che prevedono gli stati successivi, dimostrando che tale metodo supera i pianificatori basati su Transformer nella generalizzazione fuori distribuzione e nell'efficienza dei campioni, richiedendo meno dati e modelli più piccoli.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Questo articolo descrive come l'uso di un modello LLM specializzato per generare milioni di etichette di rilevanza testuale abbia permesso di migliorare significativamente il ranking dell'App Store, superando la scarsità di dati etichettati manualmente e ottenendo un aumento del tasso di conversione, specialmente per le query a coda lunga.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

How Well Do Multimodal Models Reason on ECG Signals?

Questo lavoro introduce un framework riproducibile per valutare il ragionamento dei modelli multimodali sui segnali ECG, scomponendolo in percezione (verificata tramite codice generato da agenti) e deduzione (validata contro criteri clinici strutturati) per superare i limiti delle attuali metriche di valutazione.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Questo studio presenta un framework di previsione conforme che garantisce coperture finite per l'estrazione di entità mediche basata su LLM, rivelando come la calibrazione dipenda dal dominio clinico e dimostrando che l'adattamento specifico del settore permette di raggiungere un'affidabilità superiore al 90% sia su documenti strutturati che su rapporti radiologici liberi.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

Questo rapporto tecnico valida estensivamente lo Spazio delle Soluzioni per l'Esplicabilità (ESS) attraverso una valutazione cross-dominio che, integrando un sistema urbano intelligente oltre allo studio precedente sull'abbandono dei dipendenti, ne conferma la generalizzabilità come strumento decisionale adattivo per strategie di AI spiegabile in diversi contesti socio-tecnici.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Questo lavoro presenta un framework ibrido HMM-POMDP per la strategia energetica della Formula 1 del 2026, che combina un modello a stati nascosti per inferire lo stato dei rivali da dati parzialmente osservabili con una rete neurale profonda per ottimizzare le decisioni di deployment energetico e rilevare strategie ingannevoli come la "counter-harvest trap".

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell è un framework di agenti end-to-end che automatizza la modellazione delle perturbazioni delle cellule singole risolvendo l'eterogeneità semantica tramite un unificatore guidato da LLM e l'eterogeneità statistica mediante una ricerca adattiva ad albero Monte Carlo, ottenendo prestazioni superiori ai metodi esistenti in scenari con spostamenti distribuzionali e semantici.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

Il documento presenta un nuovo framework a ciclo chiuso guidato da modelli linguistici di grandi dimensioni (LLM) che migliora l'apprendimento per rinforzo profondo adattando la riutilizzabilità delle abilità e il monitoraggio dei vincoli tramite annotazioni semantiche, ottenendo così una maggiore efficienza nei dati, conformità e trasferibilità tra ambienti diversi.

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

Il paper introduce la Compositional Probe Decomposition (CPD) per dimostrare che l'allineamento tra il compito di addestramento e la proprietà target, insieme all'architettura equivariante, determina il grado di disaccoppiamento lineare tra informazioni geometriche e composizionali nei modelli fondazionali atomistici, rivelando che canali vettoriali e scalari codificano selettivamente diverse proprietà fisiche.

Joshua Steier2026-03-10🤖 cs.LG