cs.AI artículos | Gist.Science

RAMoEA-QA: Hierarchical Specialization for Robust Respiratory Audio Question Answering

El artículo presenta RAMoEA-QA, un modelo generativo jerárquico que utiliza mecanismos de especialización condicional mediante expertos y adaptadores para unificar la comprensión de audio respiratorio heterogéneo y la generación de respuestas clínicas, logrando un rendimiento superior y una mayor generalización en comparación con los sistemas monolíticos existentes.

Gaia A. Bertolino, Yuwei Zhang, Tong Xia, Domenico Talia, Cecilia Mascolo2026-03-09🤖 cs.AI

LiveSense: A Real-Time Wi-Fi Sensing Platform for Range-Doppler on COTS Laptop

LiveSense es una plataforma en tiempo real que convierte tarjetas de red Wi-Fi comerciales en laptops en sensores de rango-Doppler de precisión centimétrica, capaces de extraer información sincronizada del estado del canal, cancelar interferencias y detectar movimientos microscópicos y gestos sin interrumpir la comunicación.

Jessica Sanson, Rahul C. Shah, Maximilian Pinaroc, Cagri Tanriover, Valerio Frascolla2026-03-09🤖 cs.AI

Boosting deep Reinforcement Learning using pretraining with Logical Options

El artículo presenta H²RL, un enfoque híbrido que utiliza una preentrenamiento basado en opciones lógicas para guiar a los agentes de aprendizaje por refuerzo profundo hacia comportamientos orientados a objetivos a largo plazo, superando así las limitaciones de las arquitecturas puramente simbólicas o neuronales en tareas de planificación compleja.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

SUREON: A Benchmark and Vision-Language-Model for Surgical Reasoning

El artículo presenta SUREON, un conjunto de datos a gran escala y dos modelos de visión-linguaje (SureonVLM y SureonVLM-R1) que aprovechan las narraciones de videos académicos quirúrgicos para entrenar sistemas de IA capaces de razonar sobre la intención, la seguridad y la anticipación en cirugías, superando significativamente a los modelos generales en tareas de percepción y razonamiento quirúrgico.

Alejandra Perez, Anita Rau, Lee White, Busisiwe Mlambo, Chinedu Nwoye, Muhammad Abdullah Jamal, Omid Mohareri2026-03-09🤖 cs.AI

Fly360: Omnidirectional Obstacle Avoidance within Drone View

El artículo presenta Fly360, un sistema de percepción y decisión en dos etapas diseñado para drones panorámicos que logra una evitación de obstáculos omnidireccional robusta, superando a los métodos tradicionales de visión frontal mediante el uso de mapas de profundidad derivados de observaciones RGB panorámicas y una estrategia de entrenamiento con guiñada aleatoria fija.

Xiangkai Zhang, Dizhe Zhang, WenZhuo Cao, Zhaoliang Wan, Yingjie Niu, Lu Qi, Xu Yang, Zhiyong Liu2026-03-09🤖 cs.AI

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

El artículo presenta BEVLM, un marco que conecta representaciones de vista aérea (BEV) con modelos de lenguaje grandes (LLM) para superar las limitaciones de consistencia espacial y riqueza semántica, mejorando significativamente tanto el razonamiento en escenarios de conducción complejos como el rendimiento en sistemas de conducción autónoma de extremo a extremo.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Motion Illusions Generated Using Predictive Neural Networks Also Fool Humans

Este artículo presenta un modelo generativo basado en redes neuronales predictivas que crea ilusiones de movimiento efectivas en humanos, respaldando la hipótesis de que estas ilusiones surgen de las predicciones cerebrales y destacando el valor de estudiar las "fallos motivados" en la inteligencia artificial.

Lana Sinapayen, Eiji Watanabe2026-03-06💻 cs

EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records

Este trabajo presenta EHRSQL, un nuevo conjunto de datos y punto de referencia práctico para la conversión de texto a SQL en registros de salud electrónicos, creado a partir de consultas reales de personal hospitalario y diseñado para abordar desafíos específicos como la complejidad de las operaciones, la comprensión de expresiones temporales y la identificación de preguntas no respondibles.

Gyubok Lee, Hyeonji Hwang, Seongsu Bae + 6 more2026-03-06💻 cs

Deep Learning Meets Mechanism Design: Key Results and Some Novel Applications

Este artículo presenta una revisión técnica y resultados clave sobre el uso del aprendizaje profundo para diseñar mecanismos que satisfagan aproximadamente propiedades deseables, demostrando su eficacia en tres casos de estudio: gestión de energía en redes vehiculares, asignación de recursos en redes móviles y subastas de descuento por volumen para insumos agrícolas.

V. Udaya Sankar, Vishisht Srihari Rao, Mayank Ratan Bhardwaj + 1 more2026-03-06💻 cs

Seeing Through Uncertainty: A Free-Energy Approach for Real-Time Perceptual Adaptation in Robust Visual Navigation

El artículo presenta FEP-Nav, un marco inspirado biológicamente que implementa la adaptación perceptiva en tiempo real para la navegación visual robusta minimizando la energía libre variacional mediante un mecanismo dual de decodificación descendente y normalización adaptativa, superando así a los métodos existentes en entornos con corrupciones sensoriales.

Maytus Piriyajitakonkij, Rishabh Dev Yadav, Mingfei Sun + 2 more2026-03-06💻 cs

Large Language Models are Contrastive Reasoners

El artículo demuestra que el "Contrastive Prompting", una técnica que solicita a los modelos de lenguaje grande generar simultáneamente una respuesta correcta y una incorrecta, mejora drásticamente su rendimiento en tareas de razonamiento complejo sin necesidad de ejemplos de entrenamiento.

Liang Yao2026-03-06💻 cs

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artículo presenta un enfoque de aprendizaje novedoso que combina la inicialización de parámetros, el aprendizaje por refuerzo con información privilegiada y el aprendizaje supervisado para resolver problemas del viajante de Dubins con vecindarios, logrando generar soluciones 50 veces más rápido que el algoritmo LKH y superando a otros métodos existentes.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

Parallel Split Learning with Global Sampling

El artículo presenta GPSL, un esquema impulsado por el servidor para el aprendizaje dividido paralelo que fija el tamaño del lote global mediante muestreo global sin reemplazo, eliminando sesgos de redondeo y estabilizando el entrenamiento en entornos no IID para lograr una precisión similar a la centralizada sin aumentar la carga computacional.

Mohammad Kohankhaki, Ahmad Ayad, Mahdi Barhoush + 1 more2026-03-06💻 cs

Why Is Anything Conscious?

Este artículo propone un formalismo que explica cómo la selección natural y la necesidad de supervivencia convierten el procesamiento de información en un fenómeno subjetivo y cualitativo, donde el valor afectivo (valencia) precede a la representación neutral de las propiedades, estableciendo así una base científica para la conciencia fenoménica.

Michael Timothy Bennett, Sean Welsh, Anna Ciaunica2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artículo presenta Path Planning (P2), una nueva estrategia de inferencia para modelos de difusión enmascarada que mejora la calidad generativa al permitir la refinación iterativa de tokens mediante un planificador, logrando así un rendimiento superior en diversas tareas como la generación de proteínas, ARN, razonamiento matemático, historias y código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Este artículo presenta FBFL, un enfoque novedoso de aprendizaje federado basado en campos que utiliza la coordinación macroprogramada y la elección de líderes espaciales para superar los desafíos de la heterogeneidad de datos no IID y la dependencia de arquitecturas centralizadas, logrando un rendimiento superior a los métodos actuales en escenarios no IID y una mayor resiliencia ante fallos del servidor.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Generative Models in Decision Making: A Survey

Esta encuesta propone un marco taxonómico unificado basado en el Control como Inferencia que clasifica los modelos generativos en cuatro roles funcionales para abordar las limitaciones del aprendizaje por refuerzo clásico, analizando su aplicación en dominios de alto riesgo y los desafíos hacia una inteligencia física generalista.

Xinyu Shao, Jianping Zhang, Haozhi Wang + 9 more2026-03-06💻 cs

Heuristics for AI-driven Graphical Asset Generation Tools in Game Design and Development Pipelines: A User-Centred Approach

Este estudio presenta un conjunto de heurísticas para herramientas de generación de activos gráficos impulsadas por IA, derivadas de una investigación con diseñadores de juegos que reveló la preferencia por el uso en etapas tempranas para generar variaciones, así como la necesidad crítica de una integración fluida en los pipelines existentes y formatos de datos compatibles.

Kaisei Fukaya, Damon Daylamani-Zad, Harry Agius2026-03-06💻 cs

The StudyChat Dataset: Analyzing Student Dialogues With ChatGPT in an Artificial Intelligence Course

Este artículo presenta StudyChat, un conjunto de datos público que analiza las interacciones reales de estudiantes universitarios con un chatbot de IA en un curso de inteligencia artificial, revelando que el uso de la herramienta para comprender conceptos y programar mejora el rendimiento académico, mientras que su uso para eludir los objetivos de aprendizaje lo reduce.

Hunter McNichols, Fareya Ikram, Andrew Lan2026-03-06💻 cs

BACE-RUL: A Bi-directional Adversarial Network with Covariate Encoding for Machine Remaining Useful Life Prediction

Este artículo presenta BACE-RUL, un marco general basado en una red adversaria bidireccional con codificación de covariables que predice la vida útil restante de máquinas utilizando únicamente mediciones de sensores del ciclo actual, superando a los métodos existentes en precisión y aplicabilidad en escenarios reales.

Zekai Zhang, Dan Li, Shunyu Wu + 4 more2026-03-06💻 cs

← Anterior Siguiente →