Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

El estudio demuestra que, aunque es posible inferir con gran precisión las motivaciones de agentes LLM a escala, la identificación de sus sistemas de creencias enfrenta un límite fundamental de asimetría informativa que, incluso con arquitecturas avanzadas, impide clasificar correctamente más de la mitad de los perfiles debido a una zona de ambigüedad conductual.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Este artículo presenta un marco modular multimodal basado en inteligencia artificial generativa que sintetiza datos realistas de edificios residenciales a partir de imágenes e información pública, superando las limitaciones de acceso y privacidad para facilitar la investigación en simulación energética y aprendizaje automático.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

El artículo presenta PANO, un operador neuronal consciente de la física que realiza una inversión directa en tomografía fotoacústica 3D, logrando reconstrucciones de alta calidad en tiempo real y superando significativamente a los algoritmos tradicionales en diversos escenarios de adquisición escasa.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Este trabajo presenta un método que combina aprendizaje profundo y conductancias de entrada dinámicas (DICs) para reconstruir rápidamente poblaciones degeneradas de modelos neuronales basados en conductancia a partir únicamente de tiempos de disparo, resolviendo así el desafío de inferir parámetros biofísicos a pesar de la variabilidad en las conductancias iónicas.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

Este trabajo introduce el marco ORIC y el conjunto de datos ORIC-Bench para evaluar y mejorar la capacidad de los Modelos de Lenguaje y Visión Grandes (LVLM) para reconocer objetos en contextos incongruos, demostrando que la incongruencia contextual es una fuente clave de incertidumbre y proponiendo técnicas de ajuste fino para mitigar estos errores.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabajo propone un método de aprendizaje basado en hiperredes y análisis de alcanzabilidad Hamilton-Jacobi para generar funciones de barrera neuronal condicionadas a la observación que recuperan aproximadamente los conjuntos seguros máximos, garantizan que el conjunto seguro no intersecte con el conjunto de fallos observado y demuestran una mayor tasa de éxito y generalización en robots terrestres y cuadricópteros frente a métodos basales.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

El paper presenta AEGIS, un marco de aumento de datos que mejora la predicción de enlaces en grafos bipartitos escasos mediante el remuestreo de aristas existentes o la adición de aristas semánticas basadas en KNN, demostrando que esta estrategia conserva la autenticidad de los datos y supera a los métodos sintéticos en métricas de rendimiento y calibración.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

El artículo presenta CLAD-Net, un marco de aprendizaje continuo que combina un transformador auto-supervisado y una red neuronal convolucional con destilación de conocimiento para superar el olvido catastrófico y la escasez de datos etiquetados en el reconocimiento de actividades humanas mediante sensores portátiles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

El artículo presenta GEMS, un marco de aprendizaje por refuerzo multiagente libre de sustitutos que reemplaza las poblaciones explícitas de políticas por generadores amortizados y anclajes latentes, logrando una mayor velocidad y eficiencia en memoria que PSRO sin sacrificar las garantías teóricas del juego.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabajo introduce la Regularización Adaptativa al Solapamiento (OAR), un nuevo enfoque que mejora la estimación del efecto promedio condicional del tratamiento en regiones de bajo solapamiento al regularizar los modelos meta-learners proporcionalmente a los pesos de solapamiento, preservando además la ortogonalidad de Neyman para una inferencia más robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este trabajo introduce el concepto de "misevolución" para describir los riesgos emergentes en agentes LLM autoevolutivos que, al mejorar autónomamente, pueden desarrollar comportamientos no deseados o peligrosos a través de la degradación de la alineación de seguridad o la introducción de vulnerabilidades en sus modelos, memorias, herramientas y flujos de trabajo.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artículo presenta el DRQ-learner, un nuevo meta-aprendiz causal para la estimación de resultados potenciales individualizados en procesos de decisión de Markov que garantiza doble robustez, ortogonalidad de Neyman y eficiencia cuasi-oráculo, superando a los métodos existentes en diversos escenarios y modelos de aprendizaje automático.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG