cs.AI artículos | Gist.Science

Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks

Este artículo propone un Canal de Lógica Explícito que, en paralelo a los modelos de lenguaje multimodal (MLLM) existentes, utiliza razonamiento lógico y evidencia visual para validar, seleccionar y mejorar el rendimiento de estos modelos en tareas de cero disparos sin necesidad de anotaciones de ground-truth, aumentando así su explicabilidad y confiabilidad.

Mei Chee Leong, Ying Gu, Hui Li Tan, Liyuan Li, Nancy Chen2026-03-13🤖 cs.AI

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning

El artículo presenta STAIRS-Former, una arquitectura Transformer con atención espaciotemporal y estructura recursiva intercalada que supera a los métodos anteriores en el aprendizaje por refuerzo multiagente multi-tarea offline al capturar dependencias temporales de largo alcance y generalizar eficazmente a poblaciones de agentes variables.

Jiwon Jeon, Myungsik Cho, Youngchul Sung2026-03-13🤖 cs.AI

OSCBench: Benchmarking Object State Change in Text-to-Video Generation

Este artículo presenta OSCBench, un nuevo benchmark diseñado para evaluar la capacidad de los modelos de generación de video a partir de texto para realizar cambios de estado en objetos, revelando que, a pesar de sus avances, los modelos actuales aún luchan con la consistencia temporal y la precisión en estas transformaciones, especialmente en escenarios novedosos y composicionales.

Xianjing Han, Bin Zhu, Shiqi Hu, Franklin Mingzhe Li, Patrick Carrington, Roger Zimmermann, Jingjing Chen2026-03-13💬 cs.CL

Scaling Laws for Educational AI Agents

Este artículo propone la "Ley de Escalamiento de Agentes", un marco que define el crecimiento de la capacidad de los agentes educativos mediante dimensiones estructuradas como la claridad de roles y la profundidad de habilidades, validado empíricamente por la plataforma EduClaw, la cual demuestra que el rendimiento escala predeciblemente con la riqueza de perfiles estructurados en lugar de depender únicamente del tamaño del modelo.

Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

Este estudio presenta un nuevo conjunto de datos y demuestra que la electromiografía de superficie (sEMG) puede decodificar con fiabilidad la frustración tanto en el habla fonada como en la silenciosa, revelando que las señales afectivas persisten en la actividad motora facial incluso sin vocalización.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. Schuller2026-03-13⚡ eess

When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows

Este trabajo propone una arquitectura basada en OpenClaw para un Sistema Operativo Agente en hospitales que, mediante un entorno de ejecución restringido, una memoria indexada por páginas y una biblioteca de habilidades médicas curadas, habilita la coordinación segura y auditada de flujos de trabajo clínicos dinámicos.

Wenxian Yang, Hanzheng Qiu, Bangqun Zhang, Chengquan Li, Zhiyong Huang, Xiaobin Feng, Rongshan Yu, Jiahong Dong2026-03-13🤖 cs.AI

Adapting Dijkstra for Buffers and Unlimited Transfers

Este trabajo presenta el algoritmo Transfer Aware Dijkstra (TAD), una modificación del Dijkstra dependiente del tiempo que supera a los métodos basados en RAPTOR al manejar correctamente los tiempos de espera en las paradas y ofrecer una velocidad de cálculo superior sin sacrificar la optimalidad de las rutas.

Denys Katkalo, Andrii Rohovyi, Toby Walsh2026-03-13🤖 cs.AI

Gender Bias in Generative AI-assisted Recruitment Processes

Este estudio evalúa el sesgo de género en el uso de la IA generativa (GPT-5) para la contratación de graduados italianos menores de 35 años y descubre que, aunque no hay diferencias significativas en los puestos sugeridos, el modelo refuerza estereotipos al atribuir rasgos emocionales a las mujeres y analíticos a los hombres.

Martina Ullasci, Marco Rondina, Riccardo Coppola, Antonio Vetrò2026-03-13🤖 cs.AI

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

El artículo presenta CINDI, un marco probabilístico no supervisado basado en flujos normalizadores condicionales que unifica la detección de anomalías y la imputación de datos en series temporales multivariantes de redes eléctricas, logrando restaurar la integridad de los datos ruidosos preservando sus propiedades físicas y estadísticas.

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI

Compression Favors Consistency, Not Truth: When and Why Language Models Prefer Correct Information

El estudio demuestra que la preferencia de los modelos de lenguaje por la información correcta no es un impulso intrínseco hacia la verdad, sino un efecto secundario de la presión de compresión que favorece hipótesis con descripciones más cortas y consistentes internamente.

Konstantin Krestnikov2026-03-13💬 cs.CL

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

Este artículo propone un método de detección de anomalías en series temporales multivariantes que traslada el análisis a un espacio latente con sesgos inductivos mediante flujos normalizadores condicionales, permitiendo identificar desviaciones de la dinámica temporal esperada incluso cuando las observaciones tienen alta probabilidad marginal.

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Este artículo presenta un algoritmo de aprendizaje social basado en energía libre para el problema de la bandaits, que permite a un agente evaluar y aprovechar la experiencia de otros agentes diversos (incluyendo no expertos) sin conocer sus recompensas, logrando convergencia óptima y un arrepentimiento logarítmico superior a los métodos existentes.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat

Understanding Wikidata Qualifiers: An Analysis and Taxonomy

Este artículo presenta un análisis exhaustivo de los calificadores de Wikidata para desarrollar una taxonomía estructurada que aborde desafíos semánticos y de consulta, evaluando su importancia mediante un índice de entropía modificado y categorizando los 300 calificadores más relevantes en cuatro grupos principales para guiar a los contribuyentes y mejorar el diseño de la base de conocimientos.

Gilles Falquet, Sahar Aljalbout2026-03-13🤖 cs.AI

Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework

Este artículo propone el marco de Memoria Gobernada por Estabilidad y Seguridad (SSGM) para abordar los riesgos emergentes de corrupción de memoria, como la deriva semántica y las vulnerabilidades de privacidad, en los agentes de modelos de lenguaje grandes mediante un mecanismo de gobernanza que desacopla la evolución de la memoria de su ejecución.

Chingkwun Lam, Jiaxin Li, Lingfei Zhang, Kuo Zhao2026-03-13🤖 cs.AI

An Automatic Text Classification Method Based on Hierarchical Taxonomies, Neural Networks and Document Embedding: The NETHIC Tool

Este trabajo presenta NETHIC, una herramienta de clasificación automática de texto que combina redes neuronales escalables con taxonomías jerárquicas y un mecanismo de incrustación de documentos, logrando resultados eficientes y efectivos tanto en corpus genéricos como específicos de dominio.

Luigi Lomasto, Rosario Di Florio, Andrea Ciapetti, Giuseppe Miscione, Giulia Ruggiero, Daniele Toti2026-03-13🤖 cs.AI

From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts

El artículo presenta la Inteligencia Colectiva Deliberativa (DCI), un marco estructurado que utiliza actos epistémicos tipificados y un algoritmo de flujo convergente para mejorar la toma de decisiones en tareas complejas mediante la integración de perspectivas y la preservación de disensos, aunque su alto costo computacional y la superioridad de los agentes individuales en tareas rutinarias limitan su aplicabilidad a contextos donde la rendición de cuentas del proceso justifica el gasto.

Sunil Prakash2026-03-13🤖 cs.AI

HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification

El artículo presenta HELM, un marco novedoso que combina tokens de clase específicos de la jerarquía, redes de convolución gráfica y aprendizaje auto-supervisado para lograr un rendimiento superior en la clasificación de imágenes multietiqueta de teledetección, especialmente en escenarios con pocas etiquetas.

Marjan Stoimchev, Boshko Koloski, Jurica Levatic, Dragi Kocev, Sašo Džeroski2026-03-13🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

Este artículo propone un método de auditoría de equidad mecánica que localiza sesgos demográficos en cabezas de atención individuales del codificador visual de CLIP, demostrando que es posible reducir el sesgo de género mediante la ablación de cabezas específicas, mientras que el sesgo de edad parece estar codificado de manera más difusa.

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-Pineau2026-03-13🤖 cs.AI

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

El documento presenta DocSage, un marco de agente end-to-end que mejora significativamente la respuesta a preguntas sobre múltiples documentos y entidades mediante la integración de descubrimiento dinámico de esquemas, extracción de información estructurada en tablas relacionales y razonamiento relacional consciente del esquema, superando así las limitaciones de los sistemas RAG y LLM existentes.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

A Semi-Decentralized Approach to Multiagent Control

Este artículo presenta un marco teórico y el algoritmo exacto RS-SDA* para el control semi-descentralizado de agentes cooperativos en entornos con incertidumbre en la comunicación, unificando los procesos de decisión de Markov parcialmente observables descentralizados (Dec-POMDP) mediante la extensión del concepto de semi-descentralización a los POMDP.

Mahdi Al-Husseini, Mykel J. Kochenderfer, Kyle H. Wray2026-03-13🤖 cs.AI

← Anterior Siguiente →