Relational Feature Caching for Accelerating Diffusion Transformers

O artigo propõe o "Relational Feature Caching" (RFC), um novo framework que acelera os Transformers de Difusão ao utilizar a correlação entre as entradas e saídas dos módulos para estimar com maior precisão as mudanças nas características e agendar cálculos completos apenas quando necessário, superando assim os métodos anteriores baseados apenas em extrapolação temporal.

Byunggwan Son, Jeimin Jeon, Jeongwoo Choi + 1 more2026-02-24🤖 cs.LG

Fore-Mamba3D: Mamba-based Foreground-Enhanced Encoding for 3D Object Detection

O artigo apresenta o Fore-Mamba3D, uma nova arquitetura baseada em Mamba que melhora a detecção de objetos 3D ao focar exclusivamente em voxels de primeiro plano, mitigando a atenuação de resposta e a representação contextual restrita através de uma janela deslizante regional para global e de um módulo de fusão espacial de estado assistido por semântica.

Zhiwei Ning, Xuanang Gao, Jiaxi Cao + 5 more2026-02-24🤖 cs.AI

Can a Teenager Fool an AI? Evaluating Low-Cost Cosmetic Attacks on Age Estimation Systems

Este estudo demonstra que modificações cosméticas simples e acessíveis, como barbas e maquiagem, podem enganar com sucesso sistemas de estimativa de idade baseados em IA, fazendo com que modelos especializados e de linguagem visual classifiquem erroneamente adolescentes como adultos, o que revela uma vulnerabilidade crítica nos pipelines de verificação de idade atuais.

Xingyu Shen, Tommy Duong, Xiaodong An + 6 more2026-02-24🤖 cs.LG

Sculpting the Vector Space: Towards Efficient Multi-Vector Visual Document Retrieval via Prune-then-Merge Framework

O artigo apresenta o framework "Prune-then-Merge", uma abordagem inovadora de duas etapas que combina poda adaptativa e fusão hierárquica para superar o compromisso entre eficiência e fidelidade de características na Recuperação de Documentos Visuais, alcançando compressão quase sem perdas e desempenho superior em 29 conjuntos de dados.

Yibo Yan, Mingdong Ou, Yi Cao + 5 more2026-02-24💬 cs.CL

HOCA-Bench: Beyond Semantic Perception to Predictive World Modeling via Hegelian Ontological-Causal Anomalies

O artigo apresenta o HOCA-Bench, um benchmark que avalia a capacidade de modelagem preditiva do mundo em Video-LLMs através de anomalias ontológicas e causais inspiradas na filosofia hegeliana, revelando que, embora os modelos atuais reconheçam bem violações estáticas, eles falham significativamente ao aplicar leis físicas básicas e raciocinar sobre mecanismos causais.

Chang Liu, Yunfan Ye, Qingyang Zhou + 5 more2026-02-24💻 cs

CLCR: Cross-Level Semantic Collaborative Representation for Multimodal Learning

O artigo propõe o CLCR, um método de representação colaborativa que organiza as características multimodais em uma hierarquia semântica de três níveis e utiliza domínios de troca e agregação intra e inter-níveis para alinhar informações compartilhadas e privadas, superando assim a desalinhamento semântico e melhorando o desempenho em diversas tarefas de aprendizado multimodal.

Chunlei Meng, Guanhong Huang, Rong Fu + 3 more2026-02-24🤖 cs.AI

Satellite-Based Detection of Looted Archaeological Sites Using Machine Learning

Este artigo apresenta um pipeline escalável baseado em imagens de satélite e aprendizado de máquina que, ao utilizar redes neurais convolucionais pré-treinadas com máscaras espaciais, alcança uma precisão superior na detecção de sítios arqueológicos saqueados na Afeganistão em comparação com métodos tradicionais de aprendizado de máquina.

Girmaw Abebe Tadesse, Titien Bartette, Andrew Hassanali + 7 more2026-02-24🤖 cs.AI

Localized Concept Erasure in Text-to-Image Diffusion Models via High-Level Representation Misdirection

O artigo propõe o método HiRM (High-Level Representation Misdirection), que realiza a eliminação precisa de conceitos indesejados em modelos de difusão texto-para-imagem ao redirecionar representações semânticas de alto nível no codificador de texto, preservando a qualidade da geração e a utilidade do modelo com baixo custo de treinamento.

Uichan Lee, Jeonghyeon Kim, Sangheum Hwang2026-02-24🤖 cs.AI