Adaptive Manipulation Potential and Haptic Estimation for Tool-Mediated Interaction

Este artículo presenta un marco de control en lazo cerrado que utiliza una variedad de equilibrio parametrizada y una estrategia híbrida de estimación háptica (haptic SLAM) para lograr una manipulación adaptativa y robusta en interacciones mediadas por herramientas, validado mediante más de 260 pruebas reales de aflojado de tornillos.

Lin Yang, Anirvan Dutta, Yuan Ji, Yanxin Zhou, Shilin Shan, Lv Chen, Etienne Burdet, Domenico Campolo2026-03-12💻 cs

S-HPLB: Efficient LLM Attention Serving via Sparsity-Aware Head Parallelism Load Balance

El artículo presenta S-HPLB, una estrategia de balanceo de carga que aprovecha la elasticidad de dispersión heterogénea pero estable entre las cabezas de atención para asignar presupuestos de dispersión adaptativos, logrando una mejora de 2.88 veces en la latencia de computación sin degradar la calidad de la inferencia.

Di Liu, Yifei Liu, Chen Chen, Zhibin Yu, Xiaoyi Fan, Quan Chen, Minyi Guo2026-03-12💻 cs

StyleGallery: Training-free and Semantic-aware Personalized Style Transfer from Arbitrary Image References

El artículo presenta StyleGallery, un marco de transferencia de estilo personalizado, sin entrenamiento y consciente del semántico que supera las limitaciones de los métodos existentes al permitir el uso de referencias arbitrarias mediante segmentación semántica adaptativa, coincidencia de regiones agrupadas y optimización guiada por energía para lograr una estilización precisa y una preservación estructural superior.

Boyu He (College of Computer Science and Technology, National University of Defense Technology), Yunfan Ye (School of Design, Hunan University), Chang Liu (College of Computer Science and Technology, National University of Defense Technology), Weishang Wu (College of Computer Science and Technology, National University of Defense Technology), Fang Liu (School of Design, Hunan University), Zhiping Cai (College of Computer Science and Technology, National University of Defense Technology)2026-03-12💻 cs

GeoSense: Internalizing Geometric Necessity Perception for Multimodal Reasoning

El paper "GeoSense" presenta un marco que dota a los Modelos de Lenguaje Multimodal Grandes (MLLM) de la capacidad de percibir la insuficiencia perceptiva y activar autónomamente características geométricas solo cuando son necesarias, mejorando así el razonamiento espacial sin comprometer la eficiencia ni la capacidad de razonamiento visual 2D.

Ruiheng Liu, Haihong Hao, Mingfei Han, Xin Gu, Kecheng Zhang, Changlin Li, Xiaojun Chang2026-03-12💻 cs

Silent Subversion: Sensor Spoofing Attacks via Supply Chain Implants in Satellite Systems

Este artículo presenta una demostración de un ataque de suplantación de sensores en satélites mediante componentes comprometidos de la cadena de suministro, que logra engañar tanto a los sistemas de navegación a bordo como a las estaciones terrestres, subrayando la necesidad urgente de contramedidas como la autenticación de telemetría y el monitoreo de la procedencia de los componentes.

Jack Vanlyssel, Gruia-Catalin Roman, Afsah Anwar2026-03-12💻 cs

Multi-Person Pose Estimation Evaluation Using Optimal Transportation and Improved Pose Matching

Este artículo propone OCpose, una nueva métrica de evaluación para la estimación de poses de múltiples personas que utiliza el transporte óptimo para equilibrar equitativamente la detección de verdaderos y falsos positivos, independientemente de sus puntuaciones de confianza, mientras aprovecha dichas puntuaciones para mejorar la fiabilidad del emparejamiento.

Takato Moriki, Hiromu Taketsugu, Norimichi Ukita2026-03-12💻 cs

Differentiable Geometric Indexing for End-to-End Generative Retrieval

El artículo presenta la Indexación Geométrica Diferenciable (DGI), un enfoque que resuelve los conflictos de optimización y geométricos en la Recuperación Generativa mediante la unificación operativa con Gumbel-Softmax y la optimización isótropa en la esfera unitaria, logrando así un rendimiento superior, especialmente en escenarios de cola larga.

Xujing Wang, Yufeng Chen, Boxuan Zhang, Jie Zhao, Chao Wei, Cai Xu, Ziyu Guan, Wei Zhao, Weiru Zhang, Xiaoyi Zeng2026-03-12💻 cs

Frames2Residual: Spatiotemporal Decoupling for Self-Supervised Video Denoising

El artículo presenta Frames2Residual (F2R), un marco de descomposición espacio-temporal que mejora el desruido de video auto-supervisado al dividir el entrenamiento en dos etapas: un estimador temporal ciego para garantizar la consistencia inter-frame y un refinador espacial no ciego para recuperar la textura intra-frame, superando así las limitaciones de las redes de punto ciego existentes.

Mingjie Ji, Zhan Shi, Kailai Zhou, Zixuan Fu, Xun Cao2026-03-12💻 cs