ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

El artículo presenta ASTER, un marco de aprendizaje por refuerzo robusto que logra, por primera vez, el vuelo invertido autónomo en sistemas de cuadricópteros con carga suspendida mediante una estrategia de inicialización de estados informada por dinámicas híbridas (HDSS) que supera los desafíos de la exploración y la transferencia simulación-real.

Dongcheng Cao, Jin Zhou, Shuo Li2026-03-12💻 cs

Sublinear-Time Reconfiguration of Programmable Matter with Joint Movements

Este artículo demuestra que es posible reconfigurar sublinealmente cualquier estructura de materia programable en una línea canónica en O(nlogn)O(\sqrt{n}\log n) rondas utilizando movimientos conjuntos centralizados, resolviendo así una cuestión abierta sobre la viabilidad de algoritmos universales sin suposiciones auxiliares.

Manish Kumar, Othon Michail, Andreas Padalkin, Christian Scheideler2026-03-12💻 cs

eLasmobranc Dataset: An Image Dataset for Elasmobranch Species Recognition and Biodiversity Monitoring

Este artículo presenta el conjunto de datos eLasmobranc, una colección pública y curada de imágenes de siete especies de elasmobranquios del Mediterráneo español, obtenidas principalmente fuera del agua bajo protocolos estandarizados para facilitar la clasificación de especies a nivel morfológico y apoyar el monitoreo de la biodiversidad y la conservación.

Ismael Beviá-Ballesteros, Mario Jerez-Tallón, Nieves Aranda-Garrido, Isabel Abel-Abellán, Irene Antón-Linares, Jorge Azorín-López, Marcelo Saval-Calvo, Andres Fuster-Guilló, Francisca Giménez-Casalduero2026-03-12💻 cs

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

El artículo presenta Pneuma-Seeker, un sistema basado en la reificación relacional que utiliza agentes de IA para transformar las necesidades de información imprecisas de los usuarios en esquemas de datos concretos y ejecutables, logrando así una mayor precisión y confianza al trabajar sobre datos relacionales heterogéneos en comparación con enfoques basados únicamente en prompts.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro Fernandez2026-03-12💻 cs

Event-based Photometric Stereo via Rotating Illumination and Per-Pixel Learning

Este trabajo propone un sistema de estereofotometría basado en eventos que utiliza una única fuente de luz rotatoria y una red neuronal ligera por píxel para estimar normales de superficie sin calibración, logrando mayor precisión y robustez ante iluminación ambiental y especularidad en comparación con métodos existentes.

Hyunwoo Kim, Won-Hoe Kim, Sanghoon Lee, Jianfei Cai, Giljoo Nam, Jae-Sang Hyun2026-03-12💻 cs

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

El artículo presenta AttriGuard, un nuevo mecanismo de defensa en tiempo real para agentes LLM que utiliza atribución causal y pruebas contrafactuales para distinguir y bloquear inyecciones de prompts indirectas en las invocaciones de herramientas, logrando una tasa de éxito de ataque del 0% con una pérdida de utilidad mínima.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan Qin2026-03-12💻 cs

CodePercept: Code-Grounded Visual STEM Perception for MLLMs

El artículo "CodePercept" identifica que las limitaciones en el razonamiento visual STEM de los modelos de lenguaje multimodal (MLLM) se deben principalmente a deficiencias perceptivas, proponiendo un nuevo paradigma que utiliza código ejecutable como medio de percepción para generar el dataset ICC-1M y el benchmark STEM2Code-Eval, logrando así una comprensión visual más precisa y verificable.

Tongkun Guan, Zhibo Yang, Jianqiang Wan, Mingkun Yang, Zhengtao Guo, Zijian Hu, Ruilin Luo, Ruize Chen, Songtao Jiang, Peng Wang, Wei Shen, Junyang Lin, Xiaokang Yang2026-03-12💻 cs

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

El documento presenta RAGPerf, un marco de referencia de código abierto y bajo costo que permite el análisis detallado y la configuración modular de sistemas de generación aumentada por recuperación (RAG) mediante la evaluación de su rendimiento, uso de recursos y precisión en diversos escenarios y componentes.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian Huang2026-03-12💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

El artículo presenta Aceso, un sistema de colocación de microservicios adaptativo diseñado para PYMES que optimiza dinámicamente la ubicación de los servicios en infraestructuras regionales limitadas para reducir las emisiones de carbono y los costos operativos sin comprometer la latencia.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra Doudali2026-03-12💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Este estudio revela que, aunque los docentes de primaria y secundaria perciben las rúbricas generadas por IA como un punto de partida útil que mejora la estructura y claridad, su adopción condicional depende de herramientas que permitan una fácil personalización y mantengan el control humano sobre el contenido y la evaluación.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica Cateté2026-03-12💻 cs

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Este estudio propone un enfoque de aprendizaje federado incremental basado en LSTM para mejorar la detección de intrusiones en redes IoT bajo un panorama de amenazas en evolución, demostrando que las estrategias de aprendizaje acumulativo y representativo ofrecen el mejor rendimiento estable frente al cambio de concepto, mientras que los métodos basados en retención equilibran eficazmente la precisión y la latencia.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh Kalakoti2026-03-12💻 cs

Phase-Interface Instance Segmentation as a Visual Sensor for Laboratory Process Monitoring

Este artículo presenta LGA-RCM-YOLO, un modelo de segmentación de instancias de interfaz de fase basado en YOLO11m que, junto con el nuevo conjunto de datos CTG 2.0, supera los desafíos de monitoreo visual en vidrio transparente para lograr una automatización de laboratorio precisa y en tiempo real.

Mingyue Li, Xin Yang, Shilin Yan, Jinye Ran, Morui Zhu, Zirui Peng, Huanqing Peng, Wei Peng, Guanghua Zhang, Shuo Li, Hao Zhang2026-03-12💻 cs

The Quadratic Geometry of Flow Matching: Semantic Granularity Alignment for Text-to-Image Synthesis

Este trabajo propone la Alineación de Granularidad Semántica (SGA), un método que aprovecha una perspectiva geométrica basada en el Kernel Tangente Neural para mitigar conflictos de gradientes en el ajuste fino de modelos de flujo, logrando así una convergencia más rápida y una mejor integridad estructural en la síntesis de imágenes a partir de texto.

Zhinan Xiong, Shunqi Yuan2026-03-12💻 cs

PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction

El artículo presenta PolGS++, un marco de representación gaussiana polarimétrica guiado por física que integra un modelo pBRDF y una máscara de visibilidad guiada por profundidad para lograr una reconstrucción rápida y precisa de superficies reflectantes mediante la decouplación de componentes difusos y especulares.

Yufei Han, Chu Zhou, Youwei Lyu, Qi Chen, Si Li, Boxin Shi, Yunpeng Jia, Heng Guo, Zhanyu Ma2026-03-12💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Este artículo presenta un marco unificado basado en hipercubos de datos comprimidos mediante estructuras arbóreas dentro del sistema Polytope, diseñado para superar las limitaciones de los modelos tradicionales y permitir una extracción eficiente y flexible de características en conjuntos de datos de ciencias de la Tierra irregulares y complejos.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin Schultz2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

El artículo presenta HanMoVLM, un modelo de visión-lingüaje grande especializado en la evaluación profesional de pinturas chinas que, mediante un dataset de obras maestras y un razonamiento paso a paso validado por expertos, cierra la brecha con la evaluación humana y actúa como verificador de alta calidad para mejorar la generación de imágenes artísticas.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs