Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Este estudio compara sistemáticamente la equidad de los rerankers con y sin capacidades de razonamiento, concluyendo que el razonamiento por sí solo no mejora ni perjudica la equidad, ya que los modelos actuales preservan las características de equidad de sus entradas y presentan brechas demográficas independientes de la arquitectura.

Saron Samuel, Benjamin Van Durme, Eugene Yang2026-03-12🤖 cs.AI

Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

El artículo presenta CGVD, un marco de inferencia libre de entrenamiento que supera la brecha entre precisión y razonamiento en modelos de visión-lenguaje-acción mediante la eliminación de distractores visuales y la preservación de la geometría espacial, logrando una tasa de éxito significativamente superior en entornos de manipulación altamente desordenados.

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick Thiyagarajan2026-03-12⚡ eess

Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

Este artículo presenta DIBJudge, un marco de ajuste fino que mitiga el sesgo de traducción automática en los modelos de lenguaje multilingüe al aprender representaciones disociadas que aíslan los factores espurios mediante compresión de información variacional y penalización de la covarianza cruzada.

Hongbin Zhang, Kehai Chen, Xuefen Bai, Youcheng Pan, Yang Xiang, Jinpeng Wang, Min Zhang2026-03-12💬 cs.CL

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

El artículo presenta HEAL, un marco de aprendizaje sin refuerzo que supera las limitaciones del destilado tradicional mediante la integración de reparación asistida por entropía, estimación de incertidumbre y un currículo evolutivo progresivo para transferir eficazmente capacidades de razonamiento de modelos grandes a modelos más pequeños.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Dynamic Knowledge Fusion for Multi-Domain Dialogue State Tracking

Este artículo presenta un marco de fusión dinámica de conocimientos que aborda los desafíos del seguimiento de estado de diálogo en múltiples dominios mediante el uso de aprendizaje contrastivo para seleccionar slots relevantes y su integración como prompts contextuales, logrando así una mayor precisión y generalización en escenarios de diálogo complejos.

Haoxiang Su, Ruiyu Fang, Liting Jiang, Xiaomeng Huang, Shuangyong Song2026-03-12💬 cs.CL

Few-Shot Adaptation to Non-Stationary Environments via Latent Trend Embedding for Robotics

Este artículo propone un marco de adaptación de pocos ejemplos para entornos no estacionarios en robótica que, en lugar de modificar los pesos del modelo, estima un identificador de tendencia latente con regularización temporal para lograr una adaptación eficiente y sin olvido catastrófico.

Yasuyuki Fujii (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Emika Kameda (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Hiroki Fukada (Production and Technology Department, NIPPN CORPORATION, Tokyo, Japan), Yoshiki Mori (University of Osaka, Osaka, Japan), Tadashi Matsuo (National Institute of Technology, Ichinoseki College, Iwate, Japan), Nobutaka Shimada (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan)2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

El documento presenta TRACED, un marco teórico que evalúa la fiabilidad del razonamiento de los LLMs mediante cinemática geométrica, identificando que las respuestas correctas siguen trayectorias de alto progreso y estabilidad, mientras que las alucinaciones se caracterizan por desplazamientos estancados y alta curvatura que revelan bucles de duda.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Este artículo presenta un marco de control probabilístico seguro para la interacción humano-robot que combina funciones de barrera de control con control de riesgo conforme para ofrecer garantías formales de seguridad, reducir las colisiones y mantener la eficiencia en tareas de navegación mediante el ajuste dinámico de los márgenes de seguridad según el contexto de interacción.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Este artículo propone técnicas de elicitation de incertidumbre basadas en probabilidades imprecisas para capturar tanto la incertidumbre de primer orden (sobre las respuestas) como la de segundo orden (sobre el modelo de probabilidad) en los grandes modelos de lenguaje, superando así las limitaciones de los marcos probabilísticos clásicos en escenarios ambiguos y mejorando la fiabilidad de la toma de decisiones.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artículo analiza la dinámica de aprendizaje de redes lineales de dos capas entrenadas con SGD y ruido en las etiquetas, revelando un comportamiento bifásico donde el ruido impulsa la transición de un régimen "perezoso" a uno "rico" para mejorar la generalización, un hallazgo que también se extiende a algoritmos como SAM y se valida mediante experimentos exhaustivos.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

El artículo presenta STemDist, el primer método de destilación de datos diseñado específicamente para la predicción espacio-temporal, que comprime de manera equilibrada las dimensiones espaciales y temporales a nivel de clúster y mediante granularidad de subconjuntos, logrando entrenamientos hasta 6 veces más rápidos, 8 veces más eficientes en memoria y con un error de predicción hasta un 12% menor en comparación con métodos existentes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG