cs.AI artículos | Gist.Science

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

Este artículo formaliza el concepto de "profundidad serial opaca" para cuantificar la capacidad de los modelos de lenguaje de realizar razonamiento interno sin pasos intermedios interpretables, estableciendo límites superiores para arquitecturas como Gemma 3 y demostrando que los modelos de mezcla de expertos probablemente poseen una profundidad menor que los modelos densos.

Jonah Brown-Cohen, David Lindner, Rohin Shah2026-03-11🤖 cs.AI

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Este artículo propone un marco híbrido cuántico-clásico que combina redes LSTM con Máquinas de Nacimiento de Circuitos Cuánticos (QCBM) para predecir la volatilidad financiera, demostrando mediante datos del mercado chino un rendimiento superior frente a los modelos clásicos en métricas clave como el error cuadrático medio.

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

El artículo propone ACP-SL, un esquema de aprendizaje dividido que utiliza una puntuación de importancia de canales basada en etiquetas para eliminar canales menos relevantes y comprimir los datos transmitidos, reduciendo así la sobrecarga de comunicación sin comprometer la precisión.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

El artículo presenta MITRA, un prototipo de asistente de IA basado en generación aumentada por recuperación (RAG) y alojado localmente para garantizar la privacidad, diseñado para facilitar la búsqueda de información en las vastas bases de datos de documentación interna de colaboraciones científicas como CMS mediante un pipeline automatizado de extracción de texto y una arquitectura de base de datos vectorial de dos niveles.

Abhishikth Mallampalli, Sridhara Dasu2026-03-11🤖 cs.AI

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Este artículo presenta el "pseudo-proyector", una modificación ligera inspirada en el paradigma multigrid que corrige las representaciones ocultas de los modelos basados en transformadores para reducir la sensibilidad al ruido y mejorar la dinámica de entrenamiento y la robustez sin alterar su arquitectura central.

Vitaly Bulgakov2026-03-11🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Este trabajo presenta MA-EgoQA, un nuevo benchmark y modelo base (EgoMAS) diseñados para evaluar y mejorar la capacidad de los sistemas de IA para comprender y coordinar múltiples videos egocéntricos de agentes corporificados mediante el uso de memoria compartida y recuperación dinámica.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

Este artículo presenta SCENEBench, un nuevo conjunto de pruebas diseñado para evaluar la comprensión auditiva de modelos de lenguaje de audio avanzados más allá del reconocimiento de voz, centrándose en casos de uso reales como la accesibilidad y la monitorización industrial mediante la medición del rendimiento y la latencia en tareas de sonido ambiental, localización de ruido, comprensión multilingüe y reconocimiento de características vocales.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Este artículo presenta HR-GAT, un modelo de red de atención gráfica jerárquica que utiliza datos geoespaciales para predecir la demanda de espectro con una precisión un 21% superior a la de modelos convencionales, abordando eficazmente los patrones espaciales complejos y la autocorrelación en cinco ciudades canadienses.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artículo presenta DAPL, un marco de aprendizaje de políticas consciente de la dinámica que facilita la destreza extrínseca en entornos desordenados mediante la modelización explícita de las interacciones de contacto, logrando un rendimiento superior al de métodos existentes tanto en simulación como en aplicaciones del mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

El artículo propone "Local Classifier Alignment" (LCA), un nuevo método de aprendizaje continuo que introduce una función de pérdida para alinear los clasificadores específicos de tareas con la red base adaptada, logrando así mitigar el olvido catastrófico y superar el rendimiento de los métodos actuales en diversos benchmarks.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Este artículo propone un marco innovador que trata los prompts como acciones parametrizadas para influir en el comportamiento de sistemas multiagente basados en LLMs sin necesidad de entrenamiento, demostrando mediante experimentos que este enfoque controla eficazmente la dinámica conversacional y facilita la simulación social.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

El artículo presenta MSSR, un marco de repetición de experiencias que estima la fuerza de la memoria a nivel de muestra y programa ensayos en intervalos adaptativos para mitigar el olvido catastrófico y mantener una adaptación rápida durante el ajuste fino continuo de modelos de lenguaje grandes.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

El artículo presenta MedMASLab, un marco unificado y plataforma de evaluación que aborda la fragmentación arquitectónica en los sistemas de agentes médicos multimodales mediante un protocolo de comunicación estandarizado, un evaluador de razonamiento clínico automatizado y el benchmark más extenso hasta la fecha, revelando brechas críticas de rendimiento al transitar entre subdominios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Este artículo presenta un enfoque basado en inteligencia artificial y aprendizaje automático que utiliza datos de licencias y crowdsourcing para estimar con precisión la demanda de espectro en cinco ciudades canadienses, logrando un coeficiente de determinación de 0,89 y ayudando a los reguladores a optimizar la planificación y asignación de recursos espectrales.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

El artículo presenta ACADiff, un marco de difusión latente adaptativo y consciente de datos clínicos que sintetiza modalidades de neuroimagen cerebrales faltantes y mejora el diagnóstico de Alzheimer incluso en escenarios con hasta un 80% de datos ausentes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Este artículo presenta una metodología basada en datos que utiliza análisis geoespacial y aprendizaje automático para estimar las variaciones de la demanda de espectro en entornos urbanos, logrando capturar el 70% de su variabilidad y ofreciendo información clave para la formulación de políticas de acceso flexible al espectro en las redes 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

El artículo presenta PathMem, un marco multimodal centrado en la memoria que imita el proceso cognitivo humano para integrar conocimientos estructurados de patología en modelos MLLM, logrando un rendimiento superior en la generación de informes y diagnósticos mediante una transformación de memoria alineada con la cognición.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

El artículo presenta k-MTR, un marco de aprendizaje de representaciones en el espacio k que alinea datos submuestreados directamente con etiquetas fisiológicas en un espacio latente compartido, superando la necesidad de reconstruir imágenes intermedias para lograr un análisis cardíaco multi-tarea preciso y eficiente.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artículo establece que la abstención basada en la confianza mejora monótonamente la calidad de las decisiones solo bajo condiciones específicas de alineación de rangos y ausencia de zonas de inversión, demostrando empíricamente que mientras la incertidumbre estructural respeta estas condiciones, la incertidumbre contextual (como la deriva temporal) las viola frecuentemente, lo que requiere señales de confianza adaptadas al tipo de incertidumbre dominante antes de implementar sistemas de decisión clasificados.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artículo presenta el Indicador de Sobreajuste-Subajuste (OUI) como una señal estructural temprana y eficiente que, al analizar los patrones de activación de las neuronas en PPO, permite discriminar con precisión entre tasas de aprendizaje óptimas e inestables mucho antes de completar el entrenamiento, diferenciando además los comportamientos ideales de las redes actor y crítico.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

← Anterior Siguiente →