Flash-KMeans: Fast and Memory-Efficient Exact K-Means

O artigo apresenta o Flash-KMeans, uma implementação otimizada para GPUs que supera os gargalos de E/S e contenção de memória das abordagens existentes, permitindo que o algoritmo k-means seja executado online com um aceleramento de até 17,9 vezes em comparação com as melhores bases e superando bibliotecas industriais como cuML e FAISS em até 200 vezes.

Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Xiaoze Fan, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Kurt Keutzer, Song Han, Chenfeng Xu, Ion StoicaWed, 11 Ma💻 cs

When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection

O artigo propõe o módulo Geometric Semantic Decoupling (GSD), uma solução sem parâmetros que elimina dependências de semântica pré-treinada em modelos de visão para forçar a detecção de evidências forenses invariantes, resultando em maior generalização e robustez na identificação de imagens geradas por IA.

Chao Shuai, Zhenguang Liu, Shaojing Fan, Bin Gong, Weichen Lian, Xiuli Bi, Zhongjie Ba, Kui RenWed, 11 Ma💻 cs

Reasoning-Oriented Programming: Chaining Semantic Gadgets to Jailbreak Large Vision Language Models

Este artigo apresenta o \tool{}, um framework automatizado que explora a "Programação Orientada a Raciocínio" para burlar os mecanismos de segurança de Modelos de Linguagem e Visão (LVLMs), combinando entradas visuais benignas e ortogonais que só geram lógica maliciosa durante o processo de raciocínio tardio, superando assim as defesas atuais focadas em padrões explícitos.

Quanchen Zou, Moyang Chen, Zonghao Ying, Wenzhuo Xu, Yisong Xiao, Deyue Zhang, Dongdong Yang, Zhao Liu, Xiangzheng ZhangWed, 11 Ma💻 cs

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

O artigo apresenta o RF-Mem, um recuperador de memória adaptativo que personaliza modelos de linguagem simulando o processo cognitivo humano ao alternar dinamicamente entre busca por familiaridade e reconstrução deliberada por recordação, superando assim as limitações de métodos existentes em termos de precisão e escalabilidade.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu ZhaoWed, 11 Ma💻 cs

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Este artigo apresenta o "Platooning as a Service" (PlaaS), uma estrutura de suporte à decisão baseada em um jogo de Stackelberg que otimiza a interação entre provedores e usuários de veículos autônomos conectados, demonstrando como políticas de preços e subsídios governamentais podem maximizar lucros e reduzir emissões de carbono, especialmente em operações de alta velocidade e urgência.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand AbrahambWed, 11 Ma💻 cs

Multimodal Graph Representation Learning with Dynamic Information Pathways

O artigo propõe o framework DiP, uma nova abordagem para aprendizado de representação em grafos multimodais que utiliza nós pseudo-específicos e caminhos de informação dinâmicos para alcançar propagação de mensagens adaptativa, expressiva e esparsa com complexidade linear, superando métodos existentes em tarefas como previsão de links e classificação de nós.

Xiaobin Hong, Mingkai Lin, Xiaoli Wang, Chaoqun Wang, Wenzhong LiWed, 11 Ma💻 cs

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos

Este artigo apresenta um novo quadro de trabalho para navegação visão-linguagem que utiliza vídeos de tours de ambientes reais da web e representações geométricas implícitas para superar as limitações de escalabilidade e diversidade dos simuladores, estabelecendo novos recordes de desempenho e permitindo agentes de navegação zero-shot mais robustos.

Mingfei Han, Haihong Hao, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan LaptevWed, 11 Ma💻 cs

On the Online Weighted Non-Crossing Matching Problem

Este artigo investiga o problema de emparelhamento não cruzado online ponderado no plano euclidiano, demonstrando que algoritmos determinísticos não garantem uma razão competitiva não trivial, enquanto algoritmos aleatorizados alcançam uma razão constante, além de estabelecer limites para variantes com revocabilidade, pontos colineares e complexidade de aconselhamento.

Joan Boyar, Shahin Kamali, Kim S. Larsen, Ali Fata Lavasani, Yaqiao Li, Denis PankratovWed, 11 Ma💻 cs

ForgeDreamer: Industrial Text-to-3D Generation with Multi-Expert LoRA and Cross-View Hypergraph

O artigo apresenta o ForgeDreamer, um novo framework que supera as limitações atuais na geração de modelos 3D industriais a partir de texto ao combinar um mecanismo de ensemble Multi-Expert LoRA para evitar interferência de conhecimento entre categorias e uma abordagem de hipergrafo multivista para capturar dependências estruturais de alta ordem essenciais para a precisão na manufatura.

Junhao Cai, Deyu Zeng, Junhao Pang, Lini Li, Zongze Wu, Xiaopin ZhongWed, 11 Ma💻 cs

Entangling Like Mycorrhizae: Mixing Realities Through Touch in "FungiSync"

O artigo apresenta o "FungiSync", uma experiência de realidade mista que traduz a interdependência das redes micorrízicas em um ritual participativo onde o toque físico entre os participantes entrelaça suas percepções digitais individuais, promovendo uma epistemologia fúngica que desafia o individualismo acelerado da era pós-humana.

Botao Amber Hu, Danlin Huang, Yilan Elan Tao, Xiaobo Aaron Hu, Rem RunGu LinWed, 11 Ma💻 cs

From Ideal to Real: Stable Video Object Removal under Imperfect Conditions

O artigo apresenta o SVOR, um novo framework robusto que supera os desafios de remoção de objetos em vídeos sob condições imperfeitas, como sombras e máscaras defeituosas, através de três inovações principais: a estratégia MUSE para fusão de máscaras, o cabeçote de segmentação DA-Seg e um treinamento em duas etapas com currículo, alcançando resultados state-of-the-art e viabilizando aplicações no mundo real.

Jiagao Hu, Yuxuan Chen, Fuhao Li, Zepeng Wang, Fei Wang, Daiguo Zhou, Jian LuanWed, 11 Ma💻 cs