OnFly: Onboard Zero-Shot Aerial Vision-Language Navigation toward Safety and Efficiency

El artículo presenta OnFly, un marco totalmente integrado a bordo que mejora la seguridad y eficiencia de la navegación aérea visión-lingüística de cero disparos mediante una arquitectura de doble agente, memoria híbrida y verificación semántico-geométrica, logrando un aumento significativo en la tasa de éxito de las tareas tanto en simulación como en vuelos reales.

Guiyong Zheng, Yueting Ban, Mingjie Zhang, Juepeng Zheng, Boyu Zhou2026-03-12💻 cs

A2^2-Edit: Precise Reference-Guided Image Editing of Arbitrary Objects and Ambiguous Masks

El paper presenta A²-Edit, un marco unificado de inpainting que permite editar objetos arbitrarios utilizando solo una máscara aproximada, respaldado por el nuevo dataset UniEdit-500K, un módulo Mixture of Transformer para manejar la diversidad de categorías y una estrategia de entrenamiento con annealing de máscaras para mejorar la robustez.

Huayu Zheng, Guangzhao Li, Baixuan Zhao, Siqi Luo, Hantao Jiang, Guangtao Zhai, Xiaohong Liu2026-03-12💻 cs

MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction

El artículo presenta MapGCLR, un enfoque semi-supervisado que mejora la construcción de mapas HD vectorizados en línea mediante aprendizaje contrastivo auto-supervisado que aprovecha la consistencia geoespacial entre superposiciones de características en vista de pájaro, logrando un rendimiento superior al de los métodos supervisados convencionales.

Jonas Merkert, Alexander Blumberg, Jan-Hendrik Pauls, Christoph Stiller2026-03-12💻 cs

UniCom: Unified Multimodal Modeling via Compressed Continuous Semantic Representations

El artículo presenta UniCom, un marco unificado que supera las limitaciones de los tokenizadores visuales discretos mediante representaciones semánticas continuas comprimidas, logrando un rendimiento de vanguardia en la generación y edición de imágenes con una convergencia rápida y una consistencia superior.

Yaqi Zhao, Wang Lin, Zijian Zhang, Miles Yang, Jingyuan Chen, Wentao Zhang, Zhao Zhong, Liefeng Bo2026-03-12💻 cs

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Mediante un experimento controlado, este estudio revela que las creencias de eficacia actúan como anclajes cognitivos que generan un optimismo sistemático hacia la IA, el cual solo se mitiga con información sobre el rendimiento de la IA, mientras que las discrepancias en estas creencias influyen más en las decisiones de delegación que en el rendimiento real del equipo humano-IA.

Philipp Spitzer, Joshua Holstein2026-03-12💻 cs

Early-Stage Cancer Biomarker Detection via Intravascular Nanomachines: Modeling and Analysis

Este estudio presenta un modelo computacional que evalúa la detección de biomarcadores de cáncer en etapas tempranas mediante nanomáquinas intravasculares, demostrando que la incorporación de características fisiológicas realistas, como el flujo no uniforme y la interacción con glóbulos rojos, reduce la probabilidad de detección en comparación con modelos simplificados, siendo los capilares el entorno más eficaz para este propósito.

Abdollah Rezagholi, Sergi Abadal, Filip Lemic, Eduard Alarcon, Ethungshan Shitiri2026-03-12💻 cs

FutureVLA: Joint Visuomotor Prediction for Vision-Language-Action Model

FutureVLA es un modelo que mejora la predicción conjunta visomotora en agentes robóticos mediante una arquitectura que desacopla la información visual y motora para capturar la continuidad temporal y los priores físicos, lo que permite a los modelos VLA existentes internalizar estas capacidades predictivas sin modificar su arquitectura de inferencia.

Xiaoxu Xu, Hao Li, Jinhui Ye, Yilun Chen, Jia Zeng, Xinyi Chen, Linning Xu, Dahua Lin, Weixin Li, Jiangmiao Pang2026-03-12💻 cs

MAVEN: A Meta-Reinforcement Learning Framework for Varying-Dynamics Expertise in Agile Quadrotor Maneuvers

El marco de aprendizaje por refuerzo meta MAVEN permite a un único policy de cuadricóptero lograr una navegación ágil y robusta mediante la adaptación en tiempo real a variaciones dinámicas extremas, como cambios de masa del 66,7% y fallos del 70% en el empuje de un rotor, logrando una transferencia exitosa de simulación a la realidad en menos de una hora de entrenamiento.

Jin Zhou, Dongcheng Cao, Xian Wang, Shuo Li2026-03-12💻 cs

ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

El artículo presenta ASTER, un marco de aprendizaje por refuerzo robusto que logra, por primera vez, el vuelo invertido autónomo en sistemas de cuadricópteros con carga suspendida mediante una estrategia de inicialización de estados informada por dinámicas híbridas (HDSS) que supera los desafíos de la exploración y la transferencia simulación-real.

Dongcheng Cao, Jin Zhou, Shuo Li2026-03-12💻 cs

Sublinear-Time Reconfiguration of Programmable Matter with Joint Movements

Este artículo demuestra que es posible reconfigurar sublinealmente cualquier estructura de materia programable en una línea canónica en O(nlogn)O(\sqrt{n}\log n) rondas utilizando movimientos conjuntos centralizados, resolviendo así una cuestión abierta sobre la viabilidad de algoritmos universales sin suposiciones auxiliares.

Manish Kumar, Othon Michail, Andreas Padalkin, Christian Scheideler2026-03-12💻 cs

eLasmobranc Dataset: An Image Dataset for Elasmobranch Species Recognition and Biodiversity Monitoring

Este artículo presenta el conjunto de datos eLasmobranc, una colección pública y curada de imágenes de siete especies de elasmobranquios del Mediterráneo español, obtenidas principalmente fuera del agua bajo protocolos estandarizados para facilitar la clasificación de especies a nivel morfológico y apoyar el monitoreo de la biodiversidad y la conservación.

Ismael Beviá-Ballesteros, Mario Jerez-Tallón, Nieves Aranda-Garrido, Isabel Abel-Abellán, Irene Antón-Linares, Jorge Azorín-López, Marcelo Saval-Calvo, Andres Fuster-Guilló, Francisca Giménez-Casalduero2026-03-12💻 cs

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

El artículo presenta Pneuma-Seeker, un sistema basado en la reificación relacional que utiliza agentes de IA para transformar las necesidades de información imprecisas de los usuarios en esquemas de datos concretos y ejecutables, logrando así una mayor precisión y confianza al trabajar sobre datos relacionales heterogéneos en comparación con enfoques basados únicamente en prompts.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro Fernandez2026-03-12💻 cs

Event-based Photometric Stereo via Rotating Illumination and Per-Pixel Learning

Este trabajo propone un sistema de estereofotometría basado en eventos que utiliza una única fuente de luz rotatoria y una red neuronal ligera por píxel para estimar normales de superficie sin calibración, logrando mayor precisión y robustez ante iluminación ambiental y especularidad en comparación con métodos existentes.

Hyunwoo Kim, Won-Hoe Kim, Sanghoon Lee, Jianfei Cai, Giljoo Nam, Jae-Sang Hyun2026-03-12💻 cs

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

El artículo presenta AttriGuard, un nuevo mecanismo de defensa en tiempo real para agentes LLM que utiliza atribución causal y pruebas contrafactuales para distinguir y bloquear inyecciones de prompts indirectas en las invocaciones de herramientas, logrando una tasa de éxito de ataque del 0% con una pérdida de utilidad mínima.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan Qin2026-03-12💻 cs

CodePercept: Code-Grounded Visual STEM Perception for MLLMs

El artículo "CodePercept" identifica que las limitaciones en el razonamiento visual STEM de los modelos de lenguaje multimodal (MLLM) se deben principalmente a deficiencias perceptivas, proponiendo un nuevo paradigma que utiliza código ejecutable como medio de percepción para generar el dataset ICC-1M y el benchmark STEM2Code-Eval, logrando así una comprensión visual más precisa y verificable.

Tongkun Guan, Zhibo Yang, Jianqiang Wan, Mingkun Yang, Zhengtao Guo, Zijian Hu, Ruilin Luo, Ruize Chen, Songtao Jiang, Peng Wang, Wei Shen, Junyang Lin, Xiaokang Yang2026-03-12💻 cs

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

El documento presenta RAGPerf, un marco de referencia de código abierto y bajo costo que permite el análisis detallado y la configuración modular de sistemas de generación aumentada por recuperación (RAG) mediante la evaluación de su rendimiento, uso de recursos y precisión en diversos escenarios y componentes.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian Huang2026-03-12💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

El artículo presenta Aceso, un sistema de colocación de microservicios adaptativo diseñado para PYMES que optimiza dinámicamente la ubicación de los servicios en infraestructuras regionales limitadas para reducir las emisiones de carbono y los costos operativos sin comprometer la latencia.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra Doudali2026-03-12💻 cs