ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly

O artigo apresenta o ReTac-ACT, uma política de aprendizado por imitação que funde visão e tato através de mecanismos de atenção cruzada, um mecanismo de controle baseado em propriocepção e um objetivo de reconstrução tátil, alcançando desempenho superior em tarefas de montagem de precisão com oclusão visual e folgas industriais rigorosas.

Minchi Ruan, LiangQing Zhou, Hongtong Li, Zongtao Wang, ZhaoMing Lu, Jianwei Zhang, Bin Fang2026-03-11💻 cs

GeoAlignCLIP: Enhancing Fine-Grained Vision-Language Alignment in Remote Sensing via Multi-Granular Consistency Learning

O artigo apresenta o GeoAlignCLIP, um framework unificado que aprimora o alinhamento visão-linguagem em imagens de sensoriamento remoto através da aprendizagem de consistência multi-granular e do uso do novo conjunto de dados RSFG-100k, superando métodos existentes em tarefas complexas e de alta granularidade.

Xiao Yang, Ronghao Fu, Zhuoran Duan, Zhiwen Lin, Xueyan Liu, Bo Yang2026-03-11💻 cs

More than the Sum: Panorama-Language Models for Adverse Omni-Scenes

Este trabalho introduz o paradigma de Modelagem Linguística Panorâmica (PLM) e o conjunto de dados PanoVQA para cenas adversas, propondo uma abordagem unificada de raciocínio 360° que supera as limitações dos modelos de visão-linguagem tradicionais baseados em imagens de campo de visão estreito.

Weijia Fan, Ruiping Liu, Jiale Wei, Yufan Chen, Junwei Zheng, Zichao Zeng, Jiaming Zhang, Qiufu Li, Linlin Shen, Rainer Stiefelhagen2026-03-11💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

Este artigo propõe uma abordagem de controle de cobertura para sistemas multi-robôs em ambientes não convexos com múltiplos obstáculos, utilizando um Gráfico de Voronoi Generalizado (GVG) dividido em fases de balanceamento de carga ponderado e cobertura colaborativa para otimizar a alocação de robôs e garantir a convergência do processo.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin Zhang2026-03-11💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

Este artigo apresenta um currículo de engenharia de IA baseado em projetos que integra práticas ágeis e ferramentas de IA para preparar estudantes de engenharia de software, demonstrando por meio de um estudo de caso que essa abordagem integrada desenvolve competências práticas, embora exija adaptações no ensino e verificação oral para garantir a aprendizagem fundamental.

Andreas Rausch, Stefan Wittek, Tobias Geger, David Inkermann2026-03-11💻 cs

Nemo: A Low-Write-Amplification Cache for Tiny Objects on Log-Structured Flash Devices

O artigo apresenta o Nemo, um novo sistema de cache para objetos pequenos em dispositivos flash que reduz a amplificação de escrita ao aumentar a probabilidade de colisão em hashes para melhorar a taxa de preenchimento dos conjuntos, enquanto utiliza um índice baseado em filtro de Bloom e rastreamento híbrido de popularidade para garantir alta eficiência de memória e baixa taxa de falhas.

Xufeng Yang, Tingting Tan, Jingxin Hu, Congming Gao, Mingyang Liu, Tianyang Jiang, Jian Chen, Linbo Long, Yina Lv, Jiwu Shu2026-03-11💻 cs

A saccade-inspired approach to image classification using visiontransformer attention maps

Este artigo propõe um método de classificação de imagens inspirado em saccades oculares que utiliza mapas de atenção do modelo DINO para focar o processamento em regiões relevantes, alcançando desempenho superior ou equivalente ao processamento completo da imagem e demonstrando a eficácia da atenção de Vision Transformers como guia para visão ativa biologicamente inspirada.

Matthis Dallain, Laurent Rodriguez, Laurent Udo Perrinet, Benoît Miramond2026-03-11💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

O artigo apresenta o OTPL-VIO, um sistema de odometria visual-inercial estéreo robusto que utiliza descritores profundos livres de treinamento e correspondência baseada em transporte ótimo para associar linhas, superando limitações em cenas de baixa textura e mudanças bruscas de iluminação com maior precisão e estabilidade em tempo real.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan Wang2026-03-11💻 cs

DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics

O artigo apresenta o DiffWind, um framework diferenciável baseado em física que unifica a modelagem de interação vento-objeto, reconstrução a partir de vídeos e simulação avançada, utilizando métodos como MPM e LBM para recuperar campos de vento e dinâmicas de objetos deformáveis com alta precisão.

Yuanhang Lei, Boming Zhao, Zesong Yang, Xingxuan Li, Tao Cheng, Haocheng Peng, Ru Zhang, Yang Yang, Siyuan Huang, Yujun Shen, Ruizhen Hu, Hujun Bao, Zhaopeng Cui2026-03-11💻 cs