LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation

Este artículo presenta "LAW & ORDER", un enfoque que utiliza adaptadores de red para el ponderamiento espacial adaptativo, mejorando significativamente tanto la síntesis de imágenes médicas mediante difusión como la segmentación eficiente de lesiones, logrando avances sustanciales en métricas de calidad generativa y precisión de segmentación en conjuntos de datos de pólipos y tumores renales.

Anugunj Naman, Ayushman Singh, Gaibo Zhang + 1 more2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Este trabajo presenta la Reconstrucción Contrastiva de Difusión (DCR), un método que integra señales contrastivas derivadas de imágenes reconstruidas dentro del proceso de difusión para equilibrar la capacidad discriminativa y la percepción de detalles en las representaciones visuales de CLIP, superando así las limitaciones de enfoques anteriores.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

Este trabajo presenta Meta-D, una arquitectura que aprovecha los metadatos categóricos de los escáneres para guiar la extracción de características y mejorar tanto la detección de tumores cerebrales como la segmentación ante la ausencia de modalidades de imagen, logrando aumentos significativos en las métricas de rendimiento y una reducción de parámetros.

SangHyuk Kim, Daniel Haehn, Sumientra Rampersad2026-03-06💻 cs

EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

El artículo presenta EchoGuard, un marco de inteligencia artificial agéntica que utiliza un grafo de conocimiento como memoria episódica y semántica para detectar patrones de comunicación manipuladora en diálogos longitudinales y guiar a los usuarios hacia el auto-descubrimiento mediante preguntas socráticas.

Ratna Kandala, Niva Manchanda, Akshata Kishore Moharir + 1 more2026-03-06🤖 cs.AI

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artículo investiga las fortalezas y debilidades de los datos para la asistencia abierta en entornos corporificados, demostrando mediante un modelo multimodal fine-tuned en el dominio sintético de Overcooked que la generalización efectiva a comportamientos y configuraciones no vistos requiere conjuntos de datos diversos que abarquen la fundamentación multimodal, la inferencia de defectos y la exposición a múltiples escenarios.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models

Este artículo presenta el marco de referencia DBC, un sistema de gobernanza en tiempo de inferencia basado en una taxonomía de 150 controles que reduce significativamente la exposición al riesgo en modelos de lenguaje grandes y mejora el cumplimiento normativo en comparación con los métodos tradicionales de moderación.

G. Madan Mohan, Veena Kiran Nambiar, Kiranmayee Janardhan2026-03-06🤖 cs.AI

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artículo presenta un enfoque pionero para la adquisición simultánea de video de resonancia magnética en tiempo real, EEG y EMG superficial, junto con un pipeline de supresión de artefactos, con el fin de capturar integralmente la actividad cerebral, muscular y articular durante la producción del habla.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation

K-Gen es un marco multimodal interpretable que utiliza modelos de lenguaje grandes para generar trayectorias realistas y diversas en la conducción autónoma mediante la predicción de puntos clave guiados por el razonamiento y la descripción visual del entorno, superando a los métodos existentes en los conjuntos de datos WOMD y nuPlan.

Mingxuan Mu, Guo Yang, Lei Chen + 2 more2026-03-06🤖 cs.AI

SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms

El marco SEA-TS presenta un agente autoevolutivo que genera y optimiza autónomamente algoritmos de pronóstico de series temporales mediante búsqueda MCTS, revisión de código y razonamiento global, logrando mejoras significativas en precisión y descubriendo patrones arquitectónicos novedosos que superan a los métodos manuales y de vanguardia.

Longkun Xu, Xiaochun Zhang, Qiantu Tuo + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudio demuestra que es posible predecir con un 80,4% de precisión el tipo de lanzamiento de béisbol analizando únicamente la cinemática 3D del cuerpo del lanzador, revelando que la mecánica del torso y la muñeca son los factores más determinantes y estableciendo un límite empírico para la información que puede obtenerse antes de que la pelota sea lanzada.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI