Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

Este trabajo presenta un agente generativo neuro-simbólico que supera las alucinaciones físicas en la simulación científica al validar y completar autónomamente los mecanismos físicos faltantes mediante razonamiento deductivo, demostrando su eficacia en la predicción correcta de la respuesta de rocas bajo presurización térmica al identificar y corregir suposiciones teóricas erróneas.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong Huang2026-03-11💻 cs

MuxGel: Simultaneous Dual-Modal Visuo-Tactile Sensing via Spatially Multiplexing and Deep Reconstruction

El artículo presenta MuxGel, un sensor visuo-táctil de doble modalidad que utiliza un patrón de tablero de ajedrez y reconstrucción profunda para capturar simultáneamente información visual externa y señales táctiles a través de una sola cámara, superando las limitaciones tradicionales de los sensores táctiles basados en visión.

Zhixian Hu, Zhengtong Xu, Sheeraz Athar, Juan Wachs, Yu She2026-03-11💻 cs

Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors

Este artículo demuestra que las defensas actuales contra puertas traseras son insuficientes porque eliminar el desencadenante original no elimina la vulnerabilidad, ya que existen "desencadenantes alternativos" que explotan la dirección latente de la puerta trasera en el espacio de características, lo que sugiere la necesidad de desarrollar defensas que se enfoquen en la representación en lugar de en los desencadenantes de entrada.

Gorka Abad, Ermes Franch, Stefanos Koffas, Stjepan Picek2026-03-11💻 cs

Deblurring structural edges in variable thickness topology optimization via density-gradient-informed projection

Este artículo presenta un método de proyección informado por el gradiente de densidad que elimina eficazmente el desenfoque de los bordes estructurales y suprime las regiones de espesor indeseable en la optimización topológica de espesor variable, mejorando la definición geométrica sin comprometer significativamente el cumplimiento estructural.

Gabriel Stankiewicz, Chaitanya Dev, Paul Steinmann2026-03-11💻 cs

TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions

El artículo presenta TIMID, una nueva arquitectura de detección de anomalías en video que utiliza aprendizaje débilmente supervisado y un dataset de simulación multi-robot para identificar errores temporales dependientes del tiempo en la ejecución de tareas complejas por parte de robots, superando las limitaciones de los modelos de visión-lingüística actuales.

Nerea Gallego (University of Zaragoza), Fernando Salanova (University of Zaragoza), Claudio Mannarano (University of Zaragoza, University of Torino), Cristian Mahulea (University of Zaragoza), Eduardo Montijano (University of Zaragoza)2026-03-11💻 cs

Test-time Ego-Exo-centric Adaptation for Action Anticipation via Multi-Label Prototype Growing and Dual-Clue Consistency

Este artículo presenta DCPGN, un nuevo método de adaptación en tiempo de prueba que utiliza un módulo de crecimiento de prototipos multi-etiqueta y una consistencia de doble pista visual-textual para anticipar acciones y cerrar la brecha entre las vistas egocéntrica y exocéntrica sin necesidad de datos de entrenamiento en el objetivo.

Zhaofeng Shi, Heqian Qiu, Lanxiao Wang, Qingbo Wu, Fanman Meng, Lili Pan, Hongliang Li2026-03-11💻 cs

Expressive Power of Property Graph Constraint Languages

Este artículo presenta el primer estudio sistemático sobre el poder expresivo del lenguaje de restricciones PG-Keys para grafos de propiedades, estableciendo una jerarquía estricta de expresividad al compararlo con las dependencias funcionales y generativas de grafos (GFD y GGD) dentro de un marco unificado, con el fin de informar la futura revisión del estándar GQL.

Stefania Dumbrava, Nadime Francis, Victor Marsault, Steven Sailly2026-03-11💻 cs

ConfCtrl: Enabling Precise Camera Control in Video Diffusion via Confidence-Aware Interpolation

El artículo presenta ConfCtrl, un marco de interpolación de video consciente de la confianza que permite a los modelos de difusión generar vistas novedosas geométricamente consistentes y visualmente plausibles a partir de solo dos imágenes, superando las limitaciones de los métodos existentes mediante una proyección ponderada por confianza y un mecanismo de corrección residual inspirado en el filtro de Kalman para manejar grandes cambios de perspectiva.

Liudi Yang, George Eskandar, Fengyi Shen, Mohammad Altillawi, Yang Bai, Chi Zhang, Ziyuan Liu, Abhinav Valada2026-03-11💻 cs

EmoSURA: Towards Accurate Evaluation of Detailed and Long-Context Emotional Speech Captions

El artículo presenta EmoSURA, un nuevo marco de evaluación que supera las limitaciones de las métricas tradicionales y los jueces basados en LLM al descomponer las descripciones emocionales de voz en unidades perceptuales atómicas para verificarlas directamente contra la señal de audio, ofreciendo así una evaluación más precisa y correlacionada con el juicio humano para textos largos.

Xin Jing, Andreas Triantafyllopoulos, Jiadong Wang, Shahin Amiriparian, Jun Luo, Björn Schuller2026-03-11💻 cs

BrainSTR: Spatio-Temporal Contrastive Learning for Interpretable Dynamic Brain Network Modeling

El artículo presenta BrainSTR, un marco de aprendizaje contrastivo espaciotemporal que modela redes cerebrales dinámicas interpretables mediante la identificación de fases críticas y subredes relacionadas con enfermedades, mejorando así el diagnóstico neuropsiquiátrico en trastornos como el autismo, el trastorno bipolar y la depresión mayor.

Guiliang Guo, Guangqi Wen, Lingwen Liu, Ruoxian Song, Peng Cao, Jinzhu Yang, Fei Wang, Xiaoli Liu, Osmar R. Zaiane2026-03-11💻 cs

VLM-Loc: Localization in Point Cloud Maps via Vision-Language Models

El artículo presenta VLM-Loc, un marco que utiliza modelos de visión-idioma para mejorar la localización en mapas de nubes de puntos mediante la transformación de datos geométricos y semánticos en representaciones estructuradas que permiten un razonamiento espacial interpretable, validado con el nuevo conjunto de datos CityLoc.

Shuhao Kang, Youqi Liao, Peijie Wang, Wenlong Liao, Qilin Zhang, Benjamin Busam, Xieyuanli Chen, Yun Liu2026-03-11💻 cs

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

Este trabajo evalúa sistemáticamente la accesibilidad del color en imágenes generadas por modelos de difusión, introduciendo la nueva métrica "CVDLoss" para cuantificar las mejoras estructurales y demostrando que los modelos actuales tienen dificultades para responder eficazmente a instrucciones enfocadas en la accesibilidad para personas con deficiencia en la visión del color.

Xinyao Zhuang, Jose Echevarria, Kaan Aksit2026-03-11💻 cs

Gap-ETH-Tight Algorithms for Hyperbolic TSP and Steiner Tree

Los autores presentan un esquema de aproximación óptimo bajo Gap-ETH para el problema del viajante y el árbol de Steiner en espacios hiperbólicos de dimensión fija, logrando un tiempo de ejecución $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)}$ mediante una nueva descomposición jerárquica llamada "cuadrícula híbrida hiperbólica" y un análisis de cruces ponderados.

Sándor Kisfaludi-Bak, Saeed Odak, Satyam Singh, Geert van Wordragen2026-03-11💻 cs

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

RecThinker es un marco de agentes que transforma la recomendación de un proceso pasivo a una investigación autónoma mediante un paradigma de Análisis-Planificar-Actuar, el cual utiliza herramientas especializadas y entrenamiento con aprendizaje por refuerzo para identificar y cubrir dinámicamente las brechas de información, logrando así un rendimiento superior en escenarios de recomendación.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng Dou2026-03-11💻 cs

Almost-Optimal Upper and Lower Bounds for Clustering in Low Dimensional Euclidean Spaces

Este trabajo mejora el tiempo de ejecución de los algoritmos de aproximación (1+ε)(1+\varepsilon) para los problemas de kk-mediana y kk-medias en espacios euclídeos de baja dimensión a $2^{\tilde{O}(1/\varepsilon)^{d-1}} \cdot n \cdot \text{polylog}(n)$ y demuestra que este límite es casi óptimo bajo la Hipótesis del Tiempo Exponencial con Brecha para 3-SAT.

Vincent Cohen-Addad, Karthik C. S., David Saulpic, Chris Schwiegelshohn2026-03-11💻 cs

MissBench: Benchmarking Multimodal Affective Analysis under Imbalanced Missing Modalities

El artículo presenta MissBench, un nuevo marco de referencia y conjunto de métricas diagnósticas diseñado para evaluar y detectar inequidades en el análisis afectivo multimodal bajo condiciones realistas de datos faltantes desbalanceados, revelando que los modelos que parecen robustos en escenarios ideales pueden presentar desequilibrios significativos en la práctica.

Tien Anh Pham, Phuong-Anh Nguyen, Duc-Trong Le, Cam-Van Thi Nguyen2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

El artículo propone un Sistema de Coherencia de Capacidades (CCS) que mapea modelos de consistencia de memoria a la revocación de autorizaciones multiagente, demostrando mediante simulación que la estrategia de coherencia dirigida por consistencia de lanzamiento (RCC) reduce drásticamente las operaciones no autorizadas en comparación con los métodos basados en tiempo, garantizando la seguridad independientemente de la velocidad de los agentes.

Vladyslav Parakhin2026-03-11💻 cs