MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

El estudio presenta MobiDock, un sistema móvil bimanual modular que permite a dos robots conectarse físicamente mediante un mecanismo de tornillo y visión por computadora para formar una plataforma unificada, logrando así una mayor estabilidad dinámica, precisión y eficiencia operativa en comparación con la cooperación independiente.

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs

Counting Through Occlusion: Framework for Open World Amodal Counting

El artículo presenta CountOCC, un marco de trabajo para el conteo amodal en entornos abiertos que supera las limitaciones de los métodos actuales al reconstruir las características de objetos oclidos mediante guía multimodal jerárquica y un objetivo de equivalencia visual, logrando así un rendimiento superior en conjuntos de datos de evaluación ocultos.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

El artículo presenta LAMP, un marco de aprendizaje por refuerzo multiagente que integra el razonamiento lingüístico en un flujo de trabajo de "pensar, hablar y decidir" para superar las limitaciones de los modelos actuales y lograr estrategias económicas más rentables, robustas e interpretables en entornos de simulación.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Multi-Order Matching Network for Alignment-Free Depth Super-Resolution

Este artículo presenta MOMNet, un marco de trabajo novedoso libre de alineación que utiliza un mecanismo de coincidencia de múltiples órdenes y una agregación adaptativa para lograr una super-resolución de profundidad robusta y de alta calidad en escenarios del mundo real donde las imágenes RGB y de profundidad no están estrictamente alineadas.

Zhengxue Wang, Zhiqiang Yan, Yuan Wu, Guangwei Gao, Xiang Li, Jian Yang2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

Este artículo presenta el Operador Neuronal Estructurado Radiativo (RSNO), un método de aprendizaje profundo que reconstruye imágenes hiperespectrales continuas a partir de observaciones multiespectrales mediante un mapeo continuo basado en principios físicos y proyecciones de consistencia angular para garantizar la coherencia espectral y eliminar distorsiones de color.

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

El artículo presenta UnfoldLDM, un marco de red de despliegue profundo que integra un modelo de difusión latente para superar las limitaciones de dependencia del modelo de degradación y el sesgo de sobre-suavizado en la restauración ciega de imágenes, logrando resultados de vanguardia mediante módulos de estimación de degradación y corrección de texturas.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Privacy Concerns and ChatGPT: Exploring Online Discourse through the Lens of Information Practice on Reddit

Este estudio analiza cómo los usuarios de Reddit negocian colectivamente las preocupaciones sobre la privacidad de ChatGPT mediante prácticas de información como la señalización de riesgos, el establecimiento de normas y la búsqueda de alternativas, revelando un proceso de construcción de sentido colectivo que ofrece insights para el diseño de IA y la alfabetización en privacidad.

S M Mehedi Zaman, Saubhagya Joshi, Yiyi Wu2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

El artículo presenta Yo'City, un marco agéntico innovador que utiliza modelos grandes y una estrategia de planificación jerárquica para generar ciudades 3D realistas, personalizadas y de escala infinita, superando a los métodos existentes mediante un ciclo de síntesis iterativo y un mecanismo de expansión guiado por relaciones espaciales y semánticas.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

El sistema DOPD mejora el rendimiento de la inferencia de modelos de lenguaje grandes (LLM) mediante una arquitectura dinámica que ajusta en tiempo real la proporción entre instancias de prellenado y decodificación para equilibrar la carga, logrando un aumento de hasta 1,5 veces en el buen rendimiento y reducciones significativas en los tiempos de respuesta en comparación con enfoques existentes.

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Este artículo presenta un marco de control multiagente asistido por modelos de lenguaje que automatiza el diseño y la adaptación de sistemas de fabricación en rollo a rollo, reduciendo el esfuerzo de ajuste manual y garantizando la seguridad mediante la identificación del sistema, la sintonización automática y la verificación de seguridad en la adaptación de simulación a realidad.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs