cs.AI artículos | Gist.Science

Towards a Neural Debugger for Python

Este trabajo introduce los "neural debuggers", modelos de lenguaje que emulan las funciones de los depuradores tradicionales permitiendo la ejecución interactiva paso a paso y la inferencia de estados, lo que sienta las bases para sistemas de codificación autónomos más avanzados.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

El estudio demuestra que, a diferencia de los humanos, el razonamiento en los modelos de lenguaje grandes aumenta consistentemente la honestidad al navegar por un espacio de representación donde las respuestas engañosas son inestables y las honestas son más robustas.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

El artículo presenta BEACON, un método que mejora la navegación guiada por lenguaje en entornos con oclusiones al predecir mapas de calor de viabilidad en vista cenital (BEV) que incluyen áreas ocultas, superando significativamente a los enfoques basados en imágenes al integrar un modelo de lenguaje visual con características de profundidad derivadas de observaciones multivista.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Este artículo extiende la ecuación de las abejas a un modelo basado en agentes que incorpora la valencia y la excitación emocional como moduladores de las tasas de interacción, demostrando cómo la contagio emocional y los puntos de inflexión estructurales influyen en la velocidad y el resultado de la toma de decisiones colectivas.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Este estudio presenta un guía impulsado por un modelo de lenguaje grande (LLM) para mejorar la accesibilidad en realidad virtual para personas ciegas o con baja visión, revelando que los usuarios lo perciben como una herramienta cuando están solos pero como un compañero social en entornos grupales, lo que genera recomendaciones de diseño para futuras interacciones.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artículo demuestra que, en escenarios realistas con características correlacionadas, la superposición en redes neuronales puede aprovechar la interferencia constructiva mediante la organización de características según sus patrones de co-activación, lo que genera estructuras semánticas y cíclicas que no se explican mediante el modelo tradicional de superposición basado en características no correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Este artículo presenta dos algoritmos de detección de puntos de cambio basados en redes neuronales y aprendizaje en línea que, al demostrar complejidad computacional lineal y convergencia a soluciones óptimas, superan a los métodos existentes en diversos conjuntos de datos sintéticos y reales.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

Este artículo presenta una visión general de la literatura sobre Aprendizaje por Refuerzo Automatizado (AutoRL), abarcando técnicas recientes basadas en modelos de lenguaje grande, métodos prometedores para su futura integración, así como los desafíos, preguntas abiertas y direcciones de investigación en este campo.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

Este trabajo propone un modelo de clasificación basado en subsecuencias que incorpora la incertidumbre de los datos como entrada adicional y ofrece explicabilidad por diseño, logrando un rendimiento comparable a los métodos de vanguardia para el análisis de series temporales astronómicas inciertas.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

A Survey of Large Language Models

Esta encuesta revisa los avances recientes en los Grandes Modelos de Lenguaje (LLM), centrándose en sus cuatro aspectos principales: preentrenamiento, ajuste de adaptación, utilización y evaluación de capacidades, además de resumir los recursos disponibles y discutir los problemas pendientes para futuras direcciones.

Wayne Xin Zhao, Kun Zhou, Junyi Li + 19 more2026-03-10💬 cs.CL

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Esta encuesta examina la aplicación de la teoría de la utilidad en el modelado cognitivo de sistemas robóticos, analizando su evolución desde arquitecturas cognitivas y sistemas de valores hasta su impacto en la toma de decisiones, la cooperación multiagente y la interacción humano-robot, mientras propone direcciones futuras y problemas abiertos en el campo.

Qin Yang2026-03-10💻 cs

Online Dispatching and Routing for Automated Guided Vehicles in Pickup and Delivery Systems on Loop-Based Graphs

Este artículo presenta un algoritmo basado en bucles para la programación y enrutamiento en línea sin conflictos de vehículos guiados automatizados (AGV) en grafos de bucle, demostrando experimentalmente que supera o iguala a otros métodos en calidad de solución con menor tiempo de cómputo.

Louis Stubbe, Jens Goemaere, Jan Goedgebeur2026-03-10💻 cs

Agent-OM: Leveraging LLM Agents for Ontology Matching

El artículo presenta Agent-OM, un nuevo marco basado en agentes de modelos de lenguaje grande que utiliza dos agentes siameses y herramientas especializadas para lograr un emparejamiento de ontologías competitivo en tareas sencillas y superior en escenarios complejos y de pocos ejemplos.

Zhangcheng Qiang, Weiqing Wang, Kerry Taylor2026-03-10💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artículo presenta una encuesta centrada en el aprendizaje automático sobre la Prueba Adaptativa Computarizada (CAT), explorando cómo las técnicas de ML pueden optimizar sus componentes clave para crear sistemas más robustos, justos y eficientes que integren la psicometría tradicional con enfoques interdisciplinarios.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

El artículo presenta FEX, un marco de explicación rápida que optimiza distribuciones de atribución mediante gradientes de política, logrando una reducción superior al 97% en el tiempo de inferencia y un 70% en el uso de memoria frente a enfoques agnósticos al modelo, sin sacrificar la calidad ni la aplicabilidad general.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artículo identifica y explica la etapa de corrupción en el ajuste fino de pocos ejemplos de modelos de difusión, proponiendo el uso de redes neuronales bayesianas para mitigar este fenómeno y mejorar la fidelidad, calidad y diversidad de las imágenes generadas sin incurrir en costos adicionales de inferencia.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

El artículo presenta LAMBDA, un sistema de análisis de datos multiagente de código abierto y sin necesidad de programación que utiliza modelos de lenguaje grandes, roles especializados de programador e inspector, y mecanismos de integración de conocimiento para facilitar la colaboración entre humanos e inteligencia artificial en tareas de análisis de datos.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

El artículo presenta OTAD, un modelo de defensa adversarial robusto que combina el entrenamiento de redes neuronales con regularización basada en transporte óptimo y la interpolación mediante problemas de integración convexa para lograr tanto una alta precisión en los datos como una continuidad Lipschitz local certificada.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este trabajo presenta el Sistema de Análisis Multimodal de Video Laringoscópico (MLVAS), una herramienta innovadora que combina datos de audio y video mediante detección de glotis, refinamiento de segmentación basado en difusión y extracción de características acústicas y visuales para asistir en el diagnóstico objetivo y automatizado de la parálisis de las cuerdas vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

← Anterior Siguiente →