OnFly: Onboard Zero-Shot Aerial Vision-Language Navigation toward Safety and Efficiency

O artigo apresenta o OnFly, um framework totalmente embarcado e em tempo real para navegação aérea visão-linguagem zero-shot, que utiliza uma arquitetura de agentes duplos, memória híbrida e verificadores semântico-geométricos para superar as limitações de estabilidade e segurança das abordagens existentes, alcançando uma taxa de sucesso significativamente superior tanto em simulações quanto em voos reais.

Guiyong Zheng, Yueting Ban, Mingjie Zhang, Juepeng Zheng, Boyu Zhou2026-03-12💻 cs

A2^2-Edit: Precise Reference-Guided Image Editing of Arbitrary Objects and Ambiguous Masks

O artigo apresenta o A²-Edit, um novo framework unificado de edição de imagens que, apoiado pelo grande conjunto de dados UniEdit-500K e por técnicas inovadoras como o módulo Mixture of Transformer e a estratégia de treinamento Mask Annealing, permite a substituição precisa de objetos arbitrários usando apenas máscaras grosseiras, superando os métodos existentes em generalização e robustez.

Huayu Zheng, Guangzhao Li, Baixuan Zhao, Siqi Luo, Hantao Jiang, Guangtao Zhai, Xiaohong Liu2026-03-12💻 cs

MapGCLR: Geospatial Contrastive Learning of Representations for Online Vectorized HD Map Construction

O artigo apresenta o MapGCLR, um método semi-supervisionado que utiliza aprendizado contrastivo geoespacial para melhorar a representação de características em visão de pássaro (BEV) na construção de mapas HD vetoriais online, superando as abordagens supervisionadas tradicionais ao aproveitar dados não rotulados com sobreposição de trajetórias.

Jonas Merkert, Alexander Blumberg, Jan-Hendrik Pauls, Christoph Stiller2026-03-12💻 cs

UniCom: Unified Multimodal Modeling via Compressed Continuous Semantic Representations

O artigo apresenta o UniCom, um modelo unificado multimodal que supera as limitações dos tokenizadores discretos e a instabilidade de representações contínuas ao utilizar um compressor semântico baseado em atenção para criar representações contínuas compactas, alcançando desempenho de ponta em geração e edição de imagens com alta consistência.

Yaqi Zhao, Wang Lin, Zijian Zhang, Miles Yang, Jingyuan Chen, Wentao Zhang, Zhao Zhong, Liefeng Bo2026-03-12💻 cs

Believing vs. Achieving -- The Disconnect between Efficacy Beliefs and Collaborative Outcomes

Este estudo experimental revela que as crenças de eficácia humana atuam como âncoras cognitivas que geram um otimismo sistemático em relação à IA, influenciando decisões de delegação de forma assimétrica dependendo do contexto, mas tendo um impacto mais fraco no desempenho real da equipe humano-IA, o que desafia abordagens focadas apenas na transparência e sugere novas diretrizes de design.

Philipp Spitzer, Joshua Holstein2026-03-12💻 cs

Early-Stage Cancer Biomarker Detection via Intravascular Nanomachines: Modeling and Analysis

Este estudo avalia a viabilidade da detecção de biomarcadores de câncer em estágio inicial por meio de nanomáquinas intravasculares, demonstrando por meio de simulações computacionais que a incorporação de características vasculares realistas reduz a probabilidade de detecção, sendo os capilares o local mais eficaz para essa função.

Abdollah Rezagholi, Sergi Abadal, Filip Lemic, Eduard Alarcon, Ethungshan Shitiri2026-03-12💻 cs

FutureVLA: Joint Visuomotor Prediction for Vision-Language-Action Model

O artigo apresenta o FutureVLA, um novo modelo de predição visuomotora conjunta que, ao desacoplar informações visuais e motoras durante o pré-treinamento e alinhar embeddings latentes no pós-treinamento, supera as limitações de modelos VLA existentes ao capturar a interdependência temporal entre percepção visual e execução motora para melhorar a previsão futura em agentes robóticos.

Xiaoxu Xu, Hao Li, Jinhui Ye, Yilun Chen, Jia Zeng, Xinyi Chen, Linning Xu, Dahua Lin, Weixin Li, Jiangmiao Pang2026-03-12💻 cs

ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

Este artigo apresenta o ASTER, um quadro de aprendizado por reforço que utiliza a semeadura de estados informada por dinâmica híbrida (HDSS) para superar a esparsidade de recompensas e realizar, pela primeira vez, o voo invertido autônomo e ágil de um quadrotor com carga suspensa, demonstrando transferência zero-shot bem-sucedida entre simulação e realidade.

Dongcheng Cao, Jin Zhou, Shuo Li2026-03-12💻 cs

Sublinear-Time Reconfiguration of Programmable Matter with Joint Movements

Este artigo demonstra que, no modelo de matéria programável com movimentos conjuntos, é possível reconfigurar qualquer estrutura amoebot em um segmento de linha canônico em tempo sublinear de O(nlogn)O(\sqrt{n}\log n), resolvendo positivamente uma questão em aberto sobre a viabilidade de algoritmos universais sem suposições auxiliares.

Manish Kumar, Othon Michail, Andreas Padalkin, Christian Scheideler2026-03-12💻 cs

eLasmobranc Dataset: An Image Dataset for Elasmobranch Species Recognition and Biodiversity Monitoring

Este artigo apresenta o conjunto de dados eLasmobranc, uma coleção pública e curada de imagens de sete espécies de elasmobrânquios da costa mediterrânea espanhola, obtidas predominantemente fora da água com protocolos padronizados para permitir a classificação de espécies de alta precisão e apoiar o monitoramento da biodiversidade e a conservação.

Ismael Beviá-Ballesteros, Mario Jerez-Tallón, Nieves Aranda-Garrido, Isabel Abel-Abellán, Irene Antón-Linares, Jorge Azorín-López, Marcelo Saval-Calvo, Andres Fuster-Guilló, Francisca Giménez-Casalduero2026-03-12💻 cs

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

O artigo apresenta o Pneuma-Seeker, um sistema que alinha agentes de IA ao trabalho humano com dados relacionais ao representar necessidades de informação como esquemas relacionais reificados e iterativamente refinados, superando a fragilidade dos LLMs em solicitações mal especificadas e demonstrando maior precisão e confiabilidade em ambientes reais.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro Fernandez2026-03-12💻 cs

Event-based Photometric Stereo via Rotating Illumination and Per-Pixel Learning

Este artigo propõe um sistema de fotometria estereoscópica baseado em eventos que utiliza uma única fonte de luz rotativa e uma rede neural leve por pixel para estimar normais de superfície com alta precisão e robustez em condições de iluminação variável e alto alcance dinâmico, sem necessidade de calibração do sistema.

Hyunwoo Kim, Won-Hoe Kim, Sanghoon Lee, Jianfei Cai, Giljoo Nam, Jae-Sang Hyun2026-03-12💻 cs

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

O artigo apresenta o AttriGuard, uma defesa de runtime para agentes de LLM que combate a injeção indireta de prompts ao utilizar atribuição causal baseada em testes contrafactuais para distinguir chamadas de ferramentas motivadas pela intenção do usuário daquelas induzidas por observações não confiáveis, alcançando uma taxa de sucesso de ataque de 0% com perda mínima de utilidade.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan Qin2026-03-12💻 cs

CodePercept: Code-Grounded Visual STEM Perception for MLLMs

O artigo "CodePercept" identifica que a percepção, e não o raciocínio, é o principal gargalo para o raciocínio visual STEM em MLLMs e propõe uma nova abordagem que utiliza código executável como meio perceptivo, fundamentado no dataset ICC-1M e avaliado pelo benchmark STEM2Code-Eval, para superar as limitações de alucinação e ambiguidade dos métodos atuais.

Tongkun Guan, Zhibo Yang, Jianqiang Wan, Mingkun Yang, Zhengtao Guo, Zijian Hu, Ruilin Luo, Ruize Chen, Songtao Jiang, Peng Wang, Wei Shen, Junyang Lin, Xiaokang Yang2026-03-12💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

O artigo apresenta o Aceso, uma solução adaptativa de placement de microsserviços para PMEs que otimiza a localização geográfica considerando carbono, custo e latência, reduzindo as emissões em 37,4% e os custos operacionais em 3,6% em comparação com implantações estáticas, enquanto atende aos requisitos de serviço.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra Doudali2026-03-12💻 cs