A comprehensive study of time-of-flight non-line-of-sight imaging

Este estudio presenta un análisis exhaustivo y unificado de diversos métodos de imagen no lineal de tiempo de vuelo (ToF NLOS), estableciendo un marco común de formulación y hardware para evaluar sus similitudes, diferencias y limitaciones de rendimiento, con el objetivo de servir como referencia para comparaciones objetivas en futuras investigaciones.

Julio Marco, Adrian Jarabo, Ji Hyun Nam, Alberto Tosi, Diego Gutierrez, Andreas Velten2026-03-11💻 cs

GeoSolver: Scaling Test-Time Reasoning in Remote Sensing with Fine-Grained Process Supervision

El artículo presenta GeoSolver, un marco innovador que mejora el razonamiento paso a paso en la interpretación de teledetección mediante el uso de un modelo de recompensa de proceso (GeoPRM) y un algoritmo de aprendizaje por refuerzo (Process-Aware Tree-GRPO) para lograr un escalado robusto en el tiempo de prueba y alcanzar el estado del arte en diversas pruebas.

Lang Sun, Ronghao Fu, Zhuoran Duan, Haoran Liu, Xueyan Liu, Bo Yang2026-03-11💻 cs

Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints

Este artículo presenta un marco de optimización de trayectorias que integra explícitamente el auto-envolvente de cables y las restricciones de tensión implícitas para manipular objetos planares deformables, demostrando que la relajación de modo implícito (IMR) supera a los enfoques conservadores al permitir que la evolución del estado genere dinámicamente envolturas que optimizan el par de giro durante las maniobras.

Yu Li, Amin Fakhari, Hamid Sadeghian2026-03-11💻 cs

ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

El artículo presenta ReTac-ACT, un modelo de aprendizaje por imitación que fusiona visión y tacto mediante mecanismos de atención bidireccional, un sistema de gating condicionado a la propiocepción y un objetivo de reconstrucción táctil, logrando un 90% de éxito en tareas de ensamblaje de precisión donde la retroalimentación visual falla debido a oclusiones.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin Fang2026-03-11💻 cs

GeoAlignCLIP: Enhancing Fine-Grained Vision-Language Alignment in Remote Sensing via Multi-Granular Consistency Learning

El artículo presenta GeoAlignCLIP, un marco unificado que mejora la alineación visión-idioma en teledetección mediante el aprendizaje de consistencia multi-granular y un nuevo conjunto de datos (RSFG-100k), logrando un rendimiento superior en tareas de detalle fino en comparación con los métodos existentes.

Xiao Yang, Ronghao Fu, Zhuoran Duan, Zhiwen Lin, Xueyan Liu, Bo Yang2026-03-11💻 cs

More than the Sum: Panorama-Language Models for Adverse Omni-Scenes

Este trabajo introduce el paradigma de Modelado Lenguaje-Panorama (PLM) y el conjunto de datos PanoVQA para escenarios adversos, proponiendo un módulo de atención dispersa panorámica que permite a los modelos de visión-lingüística existentes procesar imágenes de 360° de manera holística, superando las limitaciones de los enfoques basados en imágenes de campo estrecho.

Weijia Fan, Ruiping Liu, Jiale Wei, Yufan Chen, Junwei Zheng, Zichao Zeng, Jiaming Zhang, Qiufu Li, Linlin Shen, Rainer Stiefelhagen2026-03-11💻 cs

Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing

Este trabajo presenta un marco de estimación y control seguro para la locomoción de robots cuadrúpedos en terrenos irregulares utilizando únicamente sensores propioceptivos, el cual genera mapas del terreno y funciones de barrera de control que reducen significativamente el error de estimación y garantizan la seguridad global y local.

Peiyu Yang, Jiatao Ding, Wei Pan, Claudio Semini, Cosimo Della Santina2026-03-11💻 cs

Symbolic Discovery of Stochastic Differential Equations with Genetic Programming

Este trabajo presenta un método basado en programación genética para el descubrimiento simbólico de ecuaciones diferenciales estocásticas que optimiza conjuntamente las funciones de deriva y difusión mediante estimación de máxima verosimilitud, permitiendo la recuperación precisa de ecuaciones gobernantes, una escalabilidad eficiente y una mayor capacidad de modelado en sistemas dinámicos ruidosos.

Sigur de Vries, Sander W. Keemink, Marcel A. J. van Gerven2026-03-11💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

Este artículo presenta un currículo de ingeniería de IA basado en proyectos que integra prácticas ágiles y herramientas de IA para preparar a los estudiantes para el desarrollo de software asistido por inteligencia artificial, respaldado por un estudio de caso y una evaluación preliminar que destaca la importancia de la reflexión crítica y la verificación oral.

Andreas Rausch, Stefan Wittek, Tobias Geger, David Inkermann2026-03-11💻 cs

Nemo: A Low-Write-Amplification Cache for Tiny Objects on Log-Structured Flash Devices

El trabajo presenta Nemo, un diseño de caché optimizado para dispositivos flash log-estructurados que reduce la amplificación de escritura a nivel de aplicación mediante el aumento de colisiones de hash para mejorar la tasa de llenado de conjuntos, al tiempo que mantiene una alta eficiencia de memoria y una baja tasa de fallos gracias a un mecanismo de indexación basado en filtros de Bloom y un seguimiento híbrido de popularidad.

Xufeng Yang, Tingting Tan, Jingxin Hu, Congming Gao, Mingyang Liu, Tianyang Jiang, Jian Chen, Linbo Long, Yina Lv, Jiwu Shu2026-03-11💻 cs

A saccade-inspired approach to image classification using visiontransformer attention maps

Este artículo propone un método de clasificación de imágenes inspirado en los movimientos sacádicos humanos que utiliza los mapas de atención de un Vision Transformer (DINO) para focalizar el procesamiento en regiones clave, logrando un rendimiento comparable o superior al de la visión completa con mayor eficiencia.

Matthis Dallain, Laurent Rodriguez, Laurent Udo Perrinet, Benoît Miramond2026-03-11💻 cs