Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

El documento presenta TRACED, un marco teórico que evalúa la fiabilidad del razonamiento de los LLMs mediante cinemática geométrica, identificando que las respuestas correctas siguen trayectorias de alto progreso y estabilidad, mientras que las alucinaciones se caracterizan por desplazamientos estancados y alta curvatura que revelan bucles de duda.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Este artículo presenta un marco de control probabilístico seguro para la interacción humano-robot que combina funciones de barrera de control con control de riesgo conforme para ofrecer garantías formales de seguridad, reducir las colisiones y mantener la eficiencia en tareas de navegación mediante el ajuste dinámico de los márgenes de seguridad según el contexto de interacción.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Este artículo propone técnicas de elicitation de incertidumbre basadas en probabilidades imprecisas para capturar tanto la incertidumbre de primer orden (sobre las respuestas) como la de segundo orden (sobre el modelo de probabilidad) en los grandes modelos de lenguaje, superando así las limitaciones de los marcos probabilísticos clásicos en escenarios ambiguos y mejorando la fiabilidad de la toma de decisiones.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artículo analiza la dinámica de aprendizaje de redes lineales de dos capas entrenadas con SGD y ruido en las etiquetas, revelando un comportamiento bifásico donde el ruido impulsa la transición de un régimen "perezoso" a uno "rico" para mejorar la generalización, un hallazgo que también se extiende a algoritmos como SAM y se valida mediante experimentos exhaustivos.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

El artículo presenta STemDist, el primer método de destilación de datos diseñado específicamente para la predicción espacio-temporal, que comprime de manera equilibrada las dimensiones espaciales y temporales a nivel de clúster y mediante granularidad de subconjuntos, logrando entrenamientos hasta 6 veces más rápidos, 8 veces más eficientes en memoria y con un error de predicción hasta un 12% menor en comparación con métodos existentes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Este trabajo propone un mecanismo de defensa multinivel que combina clasificadores apilados, un autoencoder y entrenamiento adversarial para mejorar la robustez de los sistemas de detección de intrusos en redes frente a ataques generados mediante GAN y FGSM.

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Este artículo presenta un marco de aprendizaje de indicadores de salud adaptativo al dominio que combina un muestreo de lotes sincronizado por etapas de degradación y un autoencoder de fusión alineada entre dominios con mecanismos de atención cruzada para superar las discrepancias de distribución y las limitaciones estructurales en la modelado de señales de vibración complejas, logrando un rendimiento superior en sistemas de defensa y rodamientos industriales.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

El artículo demuestra que la eliminación de un sesgo de media coherente de rango uno, principal causante de la inestabilidad numérica en el entrenamiento de modelos de lenguaje con cuantización FP4, permite recuperar la estabilidad y el rendimiento cercanos a BF16 mediante una operación simple y eficiente en hardware.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

El artículo presenta FAR-Dex, un marco jerárquico que combina la generación de datos aumentados con pocas muestras y un refinamiento adaptativo de políticas residuales para lograr una manipulación hábil robusta y precisa mediante la coordinación brazo-mano, superando a los métodos actuales tanto en simulación como en el mundo real.

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

El artículo presenta UniPINN, un marco unificado de Redes Neuronales Informadas por Física (PINN) que aborda los desafíos del aprendizaje multi-tarea en ecuaciones de Navier-Stokes diversas mediante una arquitectura compartida-especializada, un mecanismo de atención entre flujos y una asignación dinámica de pesos, logrando así una mayor precisión y estabilidad en comparación con los métodos existentes.

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

El artículo presenta G-STAR, un sistema de reconocimiento automático de habla (ASR) con atribución de hablantes de extremo a extremo que combina un módulo de seguimiento temporal con un modelo de lenguaje grande (Speech-LLM) para generar transcripciones etiquetadas por hablante con consistencia global en conversaciones largas y superpuestas.

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

Este trabajo propone un marco unificado para la recomendación de noticias que modela la evolución de los intereses de los usuarios en etapas, combinando la captura de preferencias a largo plazo mediante un grafo global con el análisis de dinámicas a corto plazo a través de subgrafos temporales escalonados, superando así a los enfoques existentes en la gestión de la sensibilidad temporal de las noticias.

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

Este trabajo presenta SearchLLM, el primer modelo de lenguaje grande diseñado para la búsqueda generativa abierta, el cual utiliza un sistema de recompensas jerárquico y la optimización GRPO para alinear las respuestas con las preferencias de los usuarios y garantizar seguridad, logrando mejoras significativas en la calidad de generación y el compromiso del usuario en la plataforma RedNote.

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

Este trabajo propone un marco de alineación basado en la negociación multiagente que utiliza el aprendizaje por refuerzo a partir de la retroalimentación de IA (RLAIF) para entrenar a modelos de lenguaje grandes en la resolución de conflictos de valores mediante deliberación estructurada, logrando así una alineación con la Agencia Colectiva y una mejora en la capacidad de resolución de conflictos sin degradar las habilidades lingüísticas generales.

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Este trabajo demuestra que la exposición ingenua de las capacidades de refinamiento y razonamiento de los sistemas de IA generativa comercial, accesibles mediante instrucciones benignas, socava fundamentalmente a los detectores de deepfakes actuales al permitir la creación de imágenes que evaden la detección, preservan la identidad y mejoran la calidad perceptual, revelando una desconexión crítica entre los modelos de amenazas existentes y las capacidades reales de estas herramientas.

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI