RAMoEA-QA: Hierarchical Specialization for Robust Respiratory Audio Question Answering

El artículo presenta RAMoEA-QA, un modelo generativo jerárquico que utiliza mecanismos de especialización condicional mediante expertos y adaptadores para unificar la comprensión de audio respiratorio heterogéneo y la generación de respuestas clínicas, logrando un rendimiento superior y una mayor generalización en comparación con los sistemas monolíticos existentes.

Gaia A. Bertolino, Yuwei Zhang, Tong Xia, Domenico Talia, Cecilia Mascolo2026-03-09🤖 cs.AI

LiveSense: A Real-Time Wi-Fi Sensing Platform for Range-Doppler on COTS Laptop

LiveSense es una plataforma en tiempo real que convierte tarjetas de red Wi-Fi comerciales en laptops en sensores de rango-Doppler de precisión centimétrica, capaces de extraer información sincronizada del estado del canal, cancelar interferencias y detectar movimientos microscópicos y gestos sin interrumpir la comunicación.

Jessica Sanson, Rahul C. Shah, Maximilian Pinaroc, Cagri Tanriover, Valerio Frascolla2026-03-09🤖 cs.AI

Boosting deep Reinforcement Learning using pretraining with Logical Options

El artículo presenta H²RL, un enfoque híbrido que utiliza una preentrenamiento basado en opciones lógicas para guiar a los agentes de aprendizaje por refuerzo profundo hacia comportamientos orientados a objetivos a largo plazo, superando así las limitaciones de las arquitecturas puramente simbólicas o neuronales en tareas de planificación compleja.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

SUREON: A Benchmark and Vision-Language-Model for Surgical Reasoning

El artículo presenta SUREON, un conjunto de datos a gran escala y dos modelos de visión-linguaje (SureonVLM y SureonVLM-R1) que aprovechan las narraciones de videos académicos quirúrgicos para entrenar sistemas de IA capaces de razonar sobre la intención, la seguridad y la anticipación en cirugías, superando significativamente a los modelos generales en tareas de percepción y razonamiento quirúrgico.

Alejandra Perez, Anita Rau, Lee White, Busisiwe Mlambo, Chinedu Nwoye, Muhammad Abdullah Jamal, Omid Mohareri2026-03-09🤖 cs.AI

Fly360: Omnidirectional Obstacle Avoidance within Drone View

El artículo presenta Fly360, un sistema de percepción y decisión en dos etapas diseñado para drones panorámicos que logra una evitación de obstáculos omnidireccional robusta, superando a los métodos tradicionales de visión frontal mediante el uso de mapas de profundidad derivados de observaciones RGB panorámicas y una estrategia de entrenamiento con guiñada aleatoria fija.

Xiangkai Zhang, Dizhe Zhang, WenZhuo Cao, Zhaoliang Wan, Yingjie Niu, Lu Qi, Xu Yang, Zhiyong Liu2026-03-09🤖 cs.AI

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

El artículo presenta BEVLM, un marco que conecta representaciones de vista aérea (BEV) con modelos de lenguaje grandes (LLM) para superar las limitaciones de consistencia espacial y riqueza semántica, mejorando significativamente tanto el razonamiento en escenarios de conducción complejos como el rendimiento en sistemas de conducción autónoma de extremo a extremo.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

EHRSQL: A Practical Text-to-SQL Benchmark for Electronic Health Records

Este trabajo presenta EHRSQL, un nuevo conjunto de datos y punto de referencia práctico para la conversión de texto a SQL en registros de salud electrónicos, creado a partir de consultas reales de personal hospitalario y diseñado para abordar desafíos específicos como la complejidad de las operaciones, la comprensión de expresiones temporales y la identificación de preguntas no respondibles.

Gyubok Lee, Hyeonji Hwang, Seongsu Bae + 6 more2026-03-06💻 cs

Deep Learning Meets Mechanism Design: Key Results and Some Novel Applications

Este artículo presenta una revisión técnica y resultados clave sobre el uso del aprendizaje profundo para diseñar mecanismos que satisfagan aproximadamente propiedades deseables, demostrando su eficacia en tres casos de estudio: gestión de energía en redes vehiculares, asignación de recursos en redes móviles y subastas de descuento por volumen para insumos agrícolas.

V. Udaya Sankar, Vishisht Srihari Rao, Mayank Ratan Bhardwaj + 1 more2026-03-06💻 cs

Seeing Through Uncertainty: A Free-Energy Approach for Real-Time Perceptual Adaptation in Robust Visual Navigation

El artículo presenta FEP-Nav, un marco inspirado biológicamente que implementa la adaptación perceptiva en tiempo real para la navegación visual robusta minimizando la energía libre variacional mediante un mecanismo dual de decodificación descendente y normalización adaptativa, superando así a los métodos existentes en entornos con corrupciones sensoriales.

Maytus Piriyajitakonkij, Rishabh Dev Yadav, Mingfei Sun + 2 more2026-03-06💻 cs

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Este artículo presenta un enfoque de aprendizaje novedoso que combina la inicialización de parámetros, el aprendizaje por refuerzo con información privilegiada y el aprendizaje supervisado para resolver problemas del viajante de Dubins con vecindarios, logrando generar soluciones 50 veces más rápido que el algoritmo LKH y superando a otros métodos existentes.

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu + 2 more2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Este artículo presenta FBFL, un enfoque novedoso de aprendizaje federado basado en campos que utiliza la coordinación macroprogramada y la elección de líderes espaciales para superar los desafíos de la heterogeneidad de datos no IID y la dependencia de arquitecturas centralizadas, logrando un rendimiento superior a los métodos actuales en escenarios no IID y una mayor resiliencia ante fallos del servidor.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Heuristics for AI-driven Graphical Asset Generation Tools in Game Design and Development Pipelines: A User-Centred Approach

Este estudio presenta un conjunto de heurísticas para herramientas de generación de activos gráficos impulsadas por IA, derivadas de una investigación con diseñadores de juegos que reveló la preferencia por el uso en etapas tempranas para generar variaciones, así como la necesidad crítica de una integración fluida en los pipelines existentes y formatos de datos compatibles.

Kaisei Fukaya, Damon Daylamani-Zad, Harry Agius2026-03-06💻 cs

The StudyChat Dataset: Analyzing Student Dialogues With ChatGPT in an Artificial Intelligence Course

Este artículo presenta StudyChat, un conjunto de datos público que analiza las interacciones reales de estudiantes universitarios con un chatbot de IA en un curso de inteligencia artificial, revelando que el uso de la herramienta para comprender conceptos y programar mejora el rendimiento académico, mientras que su uso para eludir los objetivos de aprendizaje lo reduce.

Hunter McNichols, Fareya Ikram, Andrew Lan2026-03-06💻 cs