cs.AI artículos | Gist.Science

IntelliAsk: Learning to Ask High-Quality Research Questions via RLVR

El artículo presenta IntelliAsk, un modelo entrenado mediante optimización por refuerzo con verificación de recompensas (RLVR) y una nueva función de recompensa llamada IntelliReward, que genera preguntas de revisión de investigación de alta calidad, fundamentadas y sustanciales, superando a los modelos de línea base y demostrando mejoras en benchmarks de razonamiento y escritura.

Karun Sharma, Vidushee Vats, Shengzhi Li, Yuxiang Wang, Zhongtian Sun, Prayag Tiwari2026-03-09🤖 cs.AI

The Compute ICE-AGE: Invariant Compute Envelope under Addressable Graph Evolution

Este artículo presenta resultados empíricos de una implementación en C++ de un sustrato de estado semántico determinista, denominado Compute ICE-AGE, que demuestra una latencia de recorrido invariante y un consumo de recursos estable en entornos de escala masiva (hasta 25 millones de nodos), logrando una eficiencia termodinámica superior a las arquitecturas de inferencia probabilística al depender de la capacidad de memoria en lugar del volumen de tokens.

Raymond Jay Martin II2026-03-09🤖 cs.AI

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

El artículo presenta FLoRG, un marco de aprendizaje federado que optimiza el ajuste fino de modelos de lenguaje mediante la agregación de matrices Gram de baja rango y alineación Procrustes, logrando así una mayor precisión en tareas, una reducción significativa de la sobrecarga de comunicación y una convergencia teórica mejorada al eliminar errores de agregación y deriva de descomposición.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR $\rightarrow$ LLM Pipelines?

Este artículo demuestra mediante una metodología de evaluación y análisis mecanicista que, en la mayoría de los casos de uso, los modelos de lenguaje grandes de voz (Speech LLMs) actuales funcionan como cascadas costosas e ineficientes bajo ruido, perdiendo su ventaja sobre los sistemas tradicionales de reconocimiento de voz seguidos de LLM.

Jayadev Billa2026-03-09🤖 cs.AI

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

El artículo presenta EMPO $^2$ , un marco híbrido de aprendizaje por refuerzo que combina optimización on- y off-policy con memoria aumentada para superar las limitaciones de exploración de los agentes LLM, logrando mejoras significativas en rendimiento y adaptabilidad a tareas nuevas.

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

Este artículo demuestra que el colapso de modalidades en los LLM multimodales es un problema de decodificación desajustada donde la información accesible está limitada por la divergencia entre los datos y el objetivo de entrenamiento, lo que confirma que la función de puntuación del decodificador, y no la arquitectura, determina qué información se puede extraer.

Jayadev Billa2026-03-09🤖 cs.AI

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

El documento presenta CoME, una arquitectura de agentes móviles que utiliza expertos especializados y un entrenamiento progresivo junto con una estrategia Info-DPO para mejorar el razonamiento híbrido y superar a los métodos existentes en conjuntos de datos como AITZ y AMEX.

Yuxuan Liu, Weikai Xu, Kun Huang, Changyu Chen, Jiankun Zhao, Pengzhi Gao, Wei Liu, Jian Luan, Shuo Shang, Bo Du, Ji-Rong Wen, Rui Yan2026-03-09🤖 cs.AI

Theory of Code Space: Do Code Agents Understand Software Architecture?

Este artículo presenta Theory of Code Space (ToCS), un benchmark de código abierto que evalúa la capacidad de los agentes de IA para construir y mantener creencias arquitectónicas coherentes en bases de código complejas, revelando hallazgos clave sobre la dependencia del modelo en la exploración activa, el uso de mapas de creencias estructuradas y la estabilidad de la memoria.

Grigory Sapunov2026-03-09🤖 cs.AI

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Este trabajo propone una descomposición funcional de anillo tensorial reparametrizada que utiliza representaciones neuronales implícitas y un análisis en el dominio de la frecuencia para superar las limitaciones de los métodos tradicionales, logrando así una recuperación superior de datos multidimensionales tanto en mallas como fuera de ellas.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

How Well Does Agent Development Reflect Real-World Work?

Este estudio revela una desalineación significativa entre el desarrollo de agentes de IA, centrado en tareas de programación, y la distribución real del trabajo humano y el valor económico en EE. UU., proponiendo nuevos principios para crear benchmarks más representativos y útiles.

Zora Zhiruo Wang, Sanidhya Vijayvargiya, Aspen Chen, Hanmo Zhang, Venu Arvind Arangarajan, Jett Chen, Valerie Chen, Diyi Yang, Daniel Fried, Graham Neubig2026-03-09🤖 cs.AI

Multimodal Mixture-of-Experts with Retrieval Augmentation for Protein Active Site Identification

El artículo presenta MERA, un marco novedoso que combina la recuperación aumentada con una mezcla de expertos multimodal y una fusión basada en la teoría de la evidencia de Dempster-Shafer para lograr un estado del arte en la identificación precisa de sitios activos de proteínas a nivel de residuo.

Jiayang Wu, Jiale Zhou, Rubo Wang, Xingyi Zhang, Xun Lin, Tianxu Lv, Leong Hou U, Yefeng Zheng2026-03-09🤖 cs.AI

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

Este artículo presenta CLEO, un sistema de colaboración creativa humano-agente que mejora la conciencia contextual al interpretar las acciones concurrentes de los usuarios en tiempo real, y propone un modelo de decisión basado en estudios empíricos que define cuándo delegar, dirigir o trabajar simultáneamente.

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho Kim2026-03-09🤖 cs.AI

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

Este trabajo presenta Whisper-RIR-Mega, un nuevo conjunto de datos de referencia que empareja grabaciones de habla limpias con sus versiones reverberantes utilizando respuestas de impulso reales, diseñado para evaluar y mejorar la robustez de los modelos de reconocimiento automático de voz frente a las condiciones acústicas de las habitaciones.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

El artículo presenta RigidSSL, un marco de preentrenamiento auto-supervisado que integra la rigidez geométrica y la dinámica conformacional para mejorar significativamente el diseño de proteínas, la generación de nuevas estructuras y la modelación de ensambles conformacionales realistas.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

Can LLM Aid in Solving Constraints with Inductive Definitions?

Este trabajo propone un enfoque neuro-simbólico que integra modelos de lenguaje grandes con solucionadores de restricciones para generar automáticamente lemas auxiliares, logrando resolver aproximadamente un 25% más de tareas de prueba con definiciones inductivas que las herramientas actuales.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Este estudio empírico identifica cuatro temas clave sobre la gobernanza, la iteración, las restricciones operativas y la colaboración en el desarrollo de aplicaciones de IA con intervención humana, derivados del análisis de un diario retrospectivo y entrevistas con expertos, para orientar el diseño de marcos de trabajo efectivos.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

El artículo presenta "Companion", un sistema artístico que integra un robot de dibujo con modelos de lenguaje grandes para fomentar una co-creación bidireccional mediante voz y bocetos, transformando al robot en un colaborador activo capaz de generar obras con identidad estética y mérito expositivo validado por expertos.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Este estudio presenta ARC, una herramienta de diseño que integra bases de datos y utiliza IA transparente para reducir la carga cognitiva en las revisiones sistemáticas de literatura, permitiendo a los investigadores pasar de la gestión administrativa a la exploración estratégica y el juicio verificable.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

El artículo presenta RoboLayout, una extensión de LayoutVLM que genera diseños de escenas 3D semánticamente coherentes y físicamente viables para agentes encarnados mediante la integración de restricciones de alcanzabilidad diferenciables y un proceso de refinamiento local que adapta el entorno a las capacidades físicas de diversos agentes.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

← Anterior Siguiente →

cs.AI