Progressive Split Mamba: Effective State Space Modelling for Image Restoration

O artigo apresenta o Progressive Split-Mamba (PS-Mamba), um novo framework hierárquico de espaço de estados que supera as limitações de topologia e decaimento de informação dos modelos Mamba existentes em imagens, alcançando resultados superiores em tarefas de restauração de imagem através de particionamento geométrico consistente e caminhos de atalho simétricos.

Mohammed Hassanin, Nour Moustafa, Weijian Deng, Ibrahim Radwan2026-03-11💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

O artigo apresenta o SAGE, o primeiro modelo de linguagem grande multimodal (MLLM) totalmente integrado para processar nuvens de pontos brutas diretamente, tratando os dados 3D como uma "língua estrangeira" por meio de um tokenizador leve e otimização de preferências, superando assim os métodos baseados em codificadores pré-treinados em eficiência, generalização e robustez.

Sneha Paul, Zachary Patterson, Nizar Bouguila2026-03-11💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Este trabalho apresenta o STONE, um grande conjunto de dados multimodal e escalável para navegação off-road, que fornece mapas de tratabilidade 3D gerados automaticamente sem anotação manual, utilizando sensores sincronizados como LiDAR, câmeras e radares em diversos ambientes e condições.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won Choi2026-03-11💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Este artigo avalia a eficácia prática do ajuste de índices impulsionado por modelos de linguagem de grande escala (LLM) em comparação com o Database Tuning Advisor (DTA) da Microsoft, concluindo que, embora os LLMs apresentem alta variabilidade e desafios de integração, eles têm o potencial de identificar configurações superiores e oferecer insights valiosos como uma técnica complementar.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit Chaudhuri2026-03-11💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Este artigo apresenta um quadro robusto de planejamento de movimento para corridas autônomas multiagente que combina identificação topológica de lacunas via GPs esparsos e um MPC acelerado por um solver PTC, resultando em tempos de manobra reduzidos, alta taxa de sucesso em ultrapassagens e menor latência computacional na plataforma F1TENTH.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei Xie2026-03-11💻 cs

ZipPIR: High-throughput Single-server PIR without Client-side Storage

O ZipPIR é um protocolo de Recuperação de Informação Privada (PIR) de alta vazão para servidor único que elimina a necessidade de armazenamento no lado do cliente ao comprimir cifrados LWE em cifrados Paillier durante uma fase offline quase silenciosa, alcançando desempenho comparável aos melhores protocolos existentes sem os custos de comunicação ou armazenamento que os limitam.

Rasoul Akhavan Mahdavi, Abdulrahman Diaa, Florian Kerschbaum2026-03-11💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Este artigo propõe um framework hierárquico baseado no ciclo Observe-Orient-Decide-Act (H-OODA), implementado através das camadas nuvem-borda-terminal e virtualização de funções de rede, para superar os desafios de adaptabilidade e escalabilidade na tomada de decisão de enxames de UAVs em ambientes incertos.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu Han2026-03-11💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

O artigo apresenta o WESPR, um framework rápido que integra percepção geométrica e dados meteorológicos locais para prever campos de vento induzidos pelo ambiente, permitindo planejamento de trajetória e adaptação de controle proativos que reduzem significativamente o desvio e aumentam a estabilidade de drones quadricópteros em condições turbulentas.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap Tokekar2026-03-11💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Este artigo propõe uma abordagem de aprendizado de métrica baseada em descritores de ângulos interarticulares invariantes para superar as limitações de dados em reconhecimento de linguagem de sinais, permitindo transferência cruzada entre línguas com apenas alguns exemplos e superando significativamente os métodos baseados em coordenadas.

Chayanin Chamachot, Kanokphan Lertniponphan2026-03-11💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

O artigo apresenta o PIM-SHERPA, um método puramente de software que otimiza a inferência de LLMs em dispositivos ao resolver inconsistências de atributos e layout de memória em sistemas com Processamento em Memória (PIM), alcançando economias significativas de capacidade sem comprometer o desempenho.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon Yu2026-03-11💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

O artigo apresenta o TubeMLLM, um modelo fundamental unificado que combina compreensão estruturada e geração controlável para explorar a topologia de anatomias vasculares, superando os métodos existentes em consistência topológica, generalização zero-shot e robustez através de um novo conjunto de dados multimodal e uma arquitetura de atenção compartilhada.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun Gu2026-03-11💻 cs

Flash-KMeans: Fast and Memory-Efficient Exact K-Means

O artigo apresenta o Flash-KMeans, uma implementação otimizada para GPUs que supera os gargalos de E/S e contenção de memória das abordagens existentes, permitindo que o algoritmo k-means seja executado online com um aceleramento de até 17,9 vezes em comparação com as melhores bases e superando bibliotecas industriais como cuML e FAISS em até 200 vezes.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion Stoica2026-03-11💻 cs

When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection

O artigo propõe o módulo Geometric Semantic Decoupling (GSD), uma solução sem parâmetros que elimina dependências de semântica pré-treinada em modelos de visão para forçar a detecção de evidências forenses invariantes, resultando em maior generalização e robustez na identificação de imagens geradas por IA.

Chao Shuai, Zhenguang Liu, Shaojing Fan, Bin Gong, Weichen Lian, Xiuli Bi, Zhongjie Ba, Kui Ren2026-03-11💻 cs