Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

O artigo apresenta o VNOIP, um novo método baseado em Equações Diferenciais Ordinárias (ODEs) Neurais Variacionais que modela dinamicamente as tendências de popularidade da informação em redes sociais, superando as limitações de abordagens existentes ao capturar dependências de longo alcance e padrões temporais contínuos para prever com maior precisão a popularidade futura.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang LiuWed, 11 Ma💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

O artigo apresenta o SPAN-Nav, um modelo fundamental de ponta a ponta que aprimora a navegação visão-linguagem ao integrar uma consciência espacial 3D universal, extraída de um vasto conjunto de dados de ocupação e condensada em um único token para raciocínio de ações, alcançando desempenho superior em diversos cenários e validada em experimentos do mundo real.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He WangWed, 11 Ma💻 cs

Progressive Split Mamba: Effective State Space Modelling for Image Restoration

O artigo apresenta o Progressive Split-Mamba (PS-Mamba), um novo framework hierárquico de espaço de estados que supera as limitações de topologia e decaimento de informação dos modelos Mamba existentes em imagens, alcançando resultados superiores em tarefas de restauração de imagem através de particionamento geométrico consistente e caminhos de atalho simétricos.

Mohammed Hassanin, Nour Moustafa, Weijian Deng, Ibrahim RadwanWed, 11 Ma💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

O artigo apresenta o SAGE, o primeiro modelo de linguagem grande multimodal (MLLM) totalmente integrado para processar nuvens de pontos brutas diretamente, tratando os dados 3D como uma "língua estrangeira" por meio de um tokenizador leve e otimização de preferências, superando assim os métodos baseados em codificadores pré-treinados em eficiência, generalização e robustez.

Sneha Paul, Zachary Patterson, Nizar BouguilaWed, 11 Ma💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Este trabalho apresenta o STONE, um grande conjunto de dados multimodal e escalável para navegação off-road, que fornece mapas de tratabilidade 3D gerados automaticamente sem anotação manual, utilizando sensores sincronizados como LiDAR, câmeras e radares em diversos ambientes e condições.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won ChoiWed, 11 Ma💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Este artigo avalia a eficácia prática do ajuste de índices impulsionado por modelos de linguagem de grande escala (LLM) em comparação com o Database Tuning Advisor (DTA) da Microsoft, concluindo que, embora os LLMs apresentem alta variabilidade e desafios de integração, eles têm o potencial de identificar configurações superiores e oferecer insights valiosos como uma técnica complementar.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Este artigo apresenta um quadro robusto de planejamento de movimento para corridas autônomas multiagente que combina identificação topológica de lacunas via GPs esparsos e um MPC acelerado por um solver PTC, resultando em tempos de manobra reduzidos, alta taxa de sucesso em ultrapassagens e menor latência computacional na plataforma F1TENTH.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei XieWed, 11 Ma💻 cs

ZipPIR: High-throughput Single-server PIR without Client-side Storage

O ZipPIR é um protocolo de Recuperação de Informação Privada (PIR) de alta vazão para servidor único que elimina a necessidade de armazenamento no lado do cliente ao comprimir cifrados LWE em cifrados Paillier durante uma fase offline quase silenciosa, alcançando desempenho comparável aos melhores protocolos existentes sem os custos de comunicação ou armazenamento que os limitam.

Rasoul Akhavan Mahdavi, Abdulrahman Diaa, Florian KerschbaumWed, 11 Ma💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Este artigo propõe um framework hierárquico baseado no ciclo Observe-Orient-Decide-Act (H-OODA), implementado através das camadas nuvem-borda-terminal e virtualização de funções de rede, para superar os desafios de adaptabilidade e escalabilidade na tomada de decisão de enxames de UAVs em ambientes incertos.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu HanWed, 11 Ma💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

O artigo apresenta o WESPR, um framework rápido que integra percepção geométrica e dados meteorológicos locais para prever campos de vento induzidos pelo ambiente, permitindo planejamento de trajetória e adaptação de controle proativos que reduzem significativamente o desvio e aumentam a estabilidade de drones quadricópteros em condições turbulentas.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap TokekarWed, 11 Ma💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Este artigo propõe uma abordagem de aprendizado de métrica baseada em descritores de ângulos interarticulares invariantes para superar as limitações de dados em reconhecimento de linguagem de sinais, permitindo transferência cruzada entre línguas com apenas alguns exemplos e superando significativamente os métodos baseados em coordenadas.

Chayanin Chamachot, Kanokphan LertniponphanWed, 11 Ma💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

O artigo apresenta o PIM-SHERPA, um método puramente de software que otimiza a inferência de LLMs em dispositivos ao resolver inconsistências de atributos e layout de memória em sistemas com Processamento em Memória (PIM), alcançando economias significativas de capacidade sem comprometer o desempenho.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon YuWed, 11 Ma💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

O artigo apresenta o TubeMLLM, um modelo fundamental unificado que combina compreensão estruturada e geração controlável para explorar a topologia de anatomias vasculares, superando os métodos existentes em consistência topológica, generalização zero-shot e robustez através de um novo conjunto de dados multimodal e uma arquitetura de atenção compartilhada.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun GuWed, 11 Ma💻 cs