ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

Este trabajo introduce el marco ORIC y el conjunto de datos ORIC-Bench para evaluar y mejorar la capacidad de los Modelos de Lenguaje y Visión Grandes (LVLM) para reconocer objetos en contextos incongruos, demostrando que la incongruencia contextual es una fuente clave de incertidumbre y proponiendo técnicas de ajuste fino para mitigar estos errores.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabajo propone un método de aprendizaje basado en hiperredes y análisis de alcanzabilidad Hamilton-Jacobi para generar funciones de barrera neuronal condicionadas a la observación que recuperan aproximadamente los conjuntos seguros máximos, garantizan que el conjunto seguro no intersecte con el conjunto de fallos observado y demuestran una mayor tasa de éxito y generalización en robots terrestres y cuadricópteros frente a métodos basales.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

El paper presenta AEGIS, un marco de aumento de datos que mejora la predicción de enlaces en grafos bipartitos escasos mediante el remuestreo de aristas existentes o la adición de aristas semánticas basadas en KNN, demostrando que esta estrategia conserva la autenticidad de los datos y supera a los métodos sintéticos en métricas de rendimiento y calibración.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

El artículo presenta CLAD-Net, un marco de aprendizaje continuo que combina un transformador auto-supervisado y una red neuronal convolucional con destilación de conocimiento para superar el olvido catastrófico y la escasez de datos etiquetados en el reconocimiento de actividades humanas mediante sensores portátiles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

El artículo presenta GEMS, un marco de aprendizaje por refuerzo multiagente libre de sustitutos que reemplaza las poblaciones explícitas de políticas por generadores amortizados y anclajes latentes, logrando una mayor velocidad y eficiencia en memoria que PSRO sin sacrificar las garantías teóricas del juego.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabajo introduce la Regularización Adaptativa al Solapamiento (OAR), un nuevo enfoque que mejora la estimación del efecto promedio condicional del tratamiento en regiones de bajo solapamiento al regularizar los modelos meta-learners proporcionalmente a los pesos de solapamiento, preservando además la ortogonalidad de Neyman para una inferencia más robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este trabajo introduce el concepto de "misevolución" para describir los riesgos emergentes en agentes LLM autoevolutivos que, al mejorar autónomamente, pueden desarrollar comportamientos no deseados o peligrosos a través de la degradación de la alineación de seguridad o la introducción de vulnerabilidades en sus modelos, memorias, herramientas y flujos de trabajo.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artículo presenta el DRQ-learner, un nuevo meta-aprendiz causal para la estimación de resultados potenciales individualizados en procesos de decisión de Markov que garantiza doble robustez, ortogonalidad de Neyman y eficiencia cuasi-oráculo, superando a los métodos existentes en diversos escenarios y modelos de aprendizaje automático.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

El marco SelfOrg propone un sistema de autoorganización estocástica para agentes basados en LLMs que, mediante el uso de valores de Shapley aproximados y la construcción dinámica de grafos acíclicos dirigidos, optimiza la comunicación entre agentes sin supervisión externa, logrando mejoras significativas en el rendimiento, especialmente en configuraciones con modelos débiles.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

El artículo presenta CroSTAta, un transformador que utiliza un mecanismo de atención a transiciones de estado cruzadas para mejorar la robustez y el rendimiento en la manipulación robótica al modelar explícitamente patrones temporales como fallos y recuperaciones, superando significativamente a los métodos de atención estándar y redes recurrentes.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Este artículo presenta un nuevo método de doble proyección basado en autoencoders variacionales dinámicos que estima trayectorias de estado y series temporales de ruido para reconstruir sistemas dinámicos, permitiendo una evolución multietapa eficiente en un espacio de estado de baja dimensión y facilitando la comparación entre regímenes estocásticos y deterministas.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Este estudio presenta un flujo de trabajo automatizado basado en agentes de modelos de lenguaje grande que extrae y curó la base de datos de termoelectricidad más grande hasta la fecha, con más de 27,000 registros de propiedades estructurales y de rendimiento obtenidos de 10,000 artículos científicos, facilitando así el descubrimiento de materiales a gran escala.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci