cs.AI artículos | Gist.Science

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

El paper presenta NasoVoce, una interfaz montada en la nariz que fusiona señales acústicas y de vibración para capturar el habla silenciosa y susurrada de manera robusta frente al ruido, permitiendo interacciones de voz discretas y siempre disponibles con IA.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

PC-Diffuser: Path-Consistent Capsule CBF Safety Filtering for Diffusion-Based Trajectory Planner

El artículo presenta PC-Diffuser, un marco de seguridad que integra una función de barrera de cápsulas consistente con la trayectoria directamente en el bucle de desruido de los planificadores basados en difusión para garantizar la viabilidad dinámica y la seguridad sin distorsionar la geometría de la ruta aprendida.

Eugene Ku, Yiwei Lyu2026-03-12🤖 cs.AI

Does Reasoning Make Search More Fair? Comparing Fairness in Reasoning and Non-Reasoning Rerankers

Este estudio compara sistemáticamente la equidad de los rerankers con y sin capacidades de razonamiento, concluyendo que el razonamiento por sí solo no mejora ni perjudica la equidad, ya que los modelos actuales preservan las características de equidad de sus entradas y presentan brechas demográficas independientes de la arquitectura.

Saron Samuel, Benjamin Van Durme, Eugene Yang2026-03-12🤖 cs.AI

Overcoming Visual Clutter in Vision Language Action Models via Concept-Gated Visual Distillation

El artículo presenta CGVD, un marco de inferencia libre de entrenamiento que supera la brecha entre precisión y razonamiento en modelos de visión-lenguaje-acción mediante la eliminación de distractores visuales y la preservación de la geometría espacial, logrando una tasa de éxito significativamente superior en entornos de manipulación altamente desordenados.

Sangmim Song, Sarath Kodagoda, Marc Carmichael, Karthick Thiyagarajan2026-03-12⚡ eess

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

El artículo presenta FairFAL, un marco de aprendizaje activo federado adaptativo que supera los desafíos del desequilibrio de clases global y la heterogeneidad de datos mediante la selección inteligente de modelos de consulta, el etiquetado pseudo-guiado por prototipos y una estrategia de muestreo equilibrada, logrando un rendimiento superior en escenarios no IID.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

Mitigating Translationese Bias in Multilingual LLM-as-a-Judge via Disentangled Information Bottleneck

Este artículo presenta DIBJudge, un marco de ajuste fino que mitiga el sesgo de traducción automática en los modelos de lenguaje multilingüe al aprender representaciones disociadas que aíslan los factores espurios mediante compresión de información variacional y penalización de la covarianza cruzada.

Hongbin Zhang, Kehai Chen, Xuefen Bai, Youcheng Pan, Yang Xiang, Jinpeng Wang, Min Zhang2026-03-12💬 cs.CL

Utility Function is All You Need: LLM-based Congestion Control

Este trabajo presenta GenCC, un marco que utiliza modelos de lenguaje grandes (LLM) para generar automáticamente funciones de utilidad de control de congestión, logrando mejoras significativas del 37% al 142% sobre los protocolos actuales al adaptar las estrategias de optimización a requisitos específicos de la aplicación.

Neta Rozen-Schiff, Liron Schiff, Stefan Schmid2026-03-12🤖 cs.AI

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

El artículo presenta HEAL, un marco de aprendizaje sin refuerzo que supera las limitaciones del destilado tradicional mediante la integración de reparación asistida por entropía, estimación de incertidumbre y un currículo evolutivo progresivo para transferir eficazmente capacidades de razonamiento de modelos grandes a modelos más pequeños.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Dynamic Knowledge Fusion for Multi-Domain Dialogue State Tracking

Este artículo presenta un marco de fusión dinámica de conocimientos que aborda los desafíos del seguimiento de estado de diálogo en múltiples dominios mediante el uso de aprendizaje contrastivo para seleccionar slots relevantes y su integración como prompts contextuales, logrando así una mayor precisión y generalización en escenarios de diálogo complejos.

Haoxiang Su, Ruiyu Fang, Liting Jiang, Xiaomeng Huang, Shuangyong Song2026-03-12💬 cs.CL

Beyond Interleaving: Causal Attention Reformulations for Generative Recommender Systems

Este trabajo propone una reformulación causal de los sistemas de recomendación generativa mediante las arquitecturas AttnLFA y AttnMVP, las cuales eliminan la intercalación ineficiente de tokens para reducir la complejidad secuencial en un 50%, mejorar el rendimiento y disminuir el tiempo de entrenamiento en comparación con los métodos basales.

Hailing Cheng2026-03-12🤖 cs.AI

Few-Shot Adaptation to Non-Stationary Environments via Latent Trend Embedding for Robotics

Este artículo propone un marco de adaptación de pocos ejemplos para entornos no estacionarios en robótica que, en lugar de modificar los pesos del modelo, estima un identificador de tendencia latente con regularización temporal para lograr una adaptación eficiente y sin olvido catastrófico.

Yasuyuki Fujii (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Emika Kameda (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan), Hiroki Fukada (Production and Technology Department, NIPPN CORPORATION, Tokyo, Japan), Yoshiki Mori (University of Osaka, Osaka, Japan), Tadashi Matsuo (National Institute of Technology, Ichinoseki College, Iwate, Japan), Nobutaka Shimada (College of Information Science and Engineering, Ritsumeikan University, Osaka, Japan)2026-03-12🤖 cs.AI

Reactive Writers: How Co-Writing with AI Changes How We Engage with Ideas

El estudio introduce el concepto de "escritura reactiva" para describir cómo la colaboración con IA desplaza la generación de ideas hacia la evaluación de sugerencias, lo que influye sutilmente en las opiniones de los autores sin que estos sean conscientes de dicha manipulación.

Advait Bhat, Marianne Aubin Le Quéré, Mor Naaman, Maurice Jakesch2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

El artículo propone los Grafos Conceptuales Causales (CCG), un marco que combina autoencoders dispersos y aprendizaje de estructura diferenciable para mapear dependencias causales entre conceptos en el espacio latente de modelos de lenguaje, logrando una fidelidad causal significativamente superior en tareas de razonamiento paso a paso en comparación con métodos existentes.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Este artículo presenta una ley de escalado generalizada para modelos de Mezcla de Expertos (MoE) que define una fórmula óptima para la asignación dinámica de cómputo entre las capas de expertos y atención, permitiendo diseñar modelos más eficientes bajo presupuestos de recursos fijos.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Beyond Scalars: Evaluating and Understanding LLM Reasoning via Geometric Progress and Stability

El documento presenta TRACED, un marco teórico que evalúa la fiabilidad del razonamiento de los LLMs mediante cinemática geométrica, identificando que las respuestas correctas siguen trayectorias de alto progreso y estabilidad, mientras que las alucinaciones se caracterizan por desplazamientos estancados y alta curvatura que revelan bucles de duda.

Xinyan Jiang, Ninghao Liu, Di Wang, Lijie Hu2026-03-12🤖 cs.AI

Safe Probabilistic Planning for Human-Robot Interaction using Conformal Risk Control

Este artículo presenta un marco de control probabilístico seguro para la interacción humano-robot que combina funciones de barrera de control con control de riesgo conforme para ofrecer garantías formales de seguridad, reducir las colisiones y mantener la eficiencia en tareas de navegación mediante el ajuste dinámico de los márgenes de seguridad según el contexto de interacción.

Jake Gonzales, Kazuki Mizuta, Karen Leung, Lillian J. Ratliff2026-03-12🤖 cs.AI

Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Este artículo propone técnicas de elicitation de incertidumbre basadas en probabilidades imprecisas para capturar tanto la incertidumbre de primer orden (sobre las respuestas) como la de segundo orden (sobre el modelo de probabilidad) en los grandes modelos de lenguaje, superando así las limitaciones de los marcos probabilísticos clásicos en escenarios ambiguos y mejorando la fiabilidad de la toma de decisiones.

Anita Yang, Krikamol Muandet, Michele Caprio, Siu Lun Chau, Masaki Adachi2026-03-12🤖 cs.AI

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Este artículo analiza la dinámica de aprendizaje de redes lineales de dos capas entrenadas con SGD y ruido en las etiquetas, revelando un comportamiento bifásico donde el ruido impulsa la transición de un régimen "perezoso" a uno "rico" para mejorar la generalización, un hallazgo que también se extiende a algoritmos como SAM y se valida mediante experimentos exhaustivos.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Este artículo presenta PP-LUCB, un algoritmo que optimiza la selección de configuraciones de sistemas de servicio utilizando puntuaciones de modelos de lenguaje grandes corregidas mediante auditorías humanas selectivas para minimizar costos y garantizar la precisión frente a sesgos sistemáticos.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

El artículo presenta STemDist, el primer método de destilación de datos diseñado específicamente para la predicción espacio-temporal, que comprime de manera equilibrada las dimensiones espaciales y temporales a nivel de clúster y mediante granularidad de subconjuntos, logrando entrenamientos hasta 6 veces más rápidos, 8 veces más eficientes en memoria y con un error de predicción hasta un 12% menor en comparación con métodos existentes.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

← Anterior Siguiente →