AgentRaft: Automated Detection of Data Over-Exposure in LLM Agents

O artigo apresenta o AgentRaft, um novo framework automatizado que combina análise de código e raciocínio semântico para detectar e mitigar o risco de "Data Over-Exposure" (exposição excessiva de dados) em agentes de LLM, demonstrando alta eficácia na identificação de violações de privacidade em ferramentas reais.

Yixi Lin (Sun Yat-sen University, Zhuhai, Guangdong, China), Jiangrong Wu (Sun Yat-sen University, Zhuhai, Guangdong, China), Yuhong Nan (Sun Yat-sen University, Zhuhai, Guangdong, China), Xueqiang Wang (University of Central Florida, Orlando, Florida, USA), Xinyuan Zhang (Sun Yat-sen University, Zhuhai, Guangdong, China), Zibin Zheng (Sun Yat-sen University, Zhuhai, Guangdong, China)2026-03-10💻 cs

Active Inference for Micro-Gesture Recognition: EFE-Guided Temporal Sampling and Adaptive Learning

Este artigo apresenta um framework baseado em inferência ativa para reconhecimento de microgestos, que utiliza amostragem temporal guiada por Energia Livre Esperada (EFE) e aprendizado adaptativo orientado pela incerteza para superar desafios como baixa amplitude, ruído e variabilidade inter-subjetiva, demonstrando melhorias consistentes no conjunto de dados SMG.

Weijia Feng, Jingyu Yang, Ruojia Zhang, Fengtao Sun, Qian Gao, Chenyang Wang, Tongtong Su, Jia Guo, Xiaobai Li, Minglai Shao2026-03-10💻 cs

PureCC: Pure Learning for Text-to-Image Concept Customization

O artigo apresenta o PureCC, um método inovador de personalização de conceitos que utiliza um objetivo de aprendizado desacoplado e um pipeline de treinamento de dupla ramificação para alcançar alta fidelidade na geração de imagens personalizadas enquanto preserva significativamente o comportamento e as capacidades originais do modelo.

Zhichao Liao, Xiaole Xian, Qingyu Li, Wenyu Qin, Meng Wang, Weicheng Xie, Siyang Song, Pingfa Feng, Long Zeng, Liang Pan2026-03-10💻 cs

Brain-WM: Brain Glioblastoma World Model

O artigo apresenta o Brain-WM, um modelo de mundo pioneiro para glioblastoma que utiliza uma arquitetura inovadora de Mixture-of-Transformers em formato de Y para unificar a previsão de tratamentos e a geração de futuras ressonâncias magnéticas, capturando assim a dinâmica coevolutiva entre o tumor e as intervenções terapêuticas para otimizar os resultados clínicos.

Chenhui Wang, Boyun Zheng, Liuxin Bao, Zhihao Peng, Peter Y. M. Woo, Hongming Shan, Yixuan Yuan2026-03-10💻 cs

SiamGM: Siamese Geometry-Aware and Motion-Guided Network for Real-Time Satellite Video Object Tracking

O artigo apresenta o SiamGM, uma rede Siamesa inovadora que combina atenção gráfica interquadro e orientação por vetores de movimento para rastrear objetos em vídeos de satélite em tempo real, superando desafios como alvos pequenos e oclusões com alta precisão e sem sobrecarga computacional.

Zixiao Wen, Zhen Yang, Jiawei Li, Xiantai Xiang, Guangyao Zhou, Yuxin Hu, Yuhan Liu2026-03-10💻 cs

Efficient RGB-D Scene Understanding via Multi-task Adaptive Learning and Cross-dimensional Feature Guidance

Este artigo apresenta um modelo eficiente de compreensão de cenas RGB-D que utiliza aprendizado adaptativo multi-tarefa e orientação de características entre dimensões para superar limitações tradicionais, alcançando desempenho superior em precisão e velocidade em tarefas como segmentação semântica, de instâncias e classificação de cenas.

Guodong Sun, Junjie Liu, Gaoyang Zhang, Bo Wu, Yang Zhang2026-03-10💻 cs

Approximate Imitation Learning for Event-based Quadrotor Flight in Cluttered Environments

Este artigo apresenta uma abordagem inovadora de Aprendizado por Imitação Aproximada que permite a um quadricóptero voar em alta velocidade (até 9,8 m/s) em ambientes cluttered utilizando apenas uma câmera de eventos, superando as limitações de simulação ao treinar uma rede neural end-to-end com dados de estado simulados leves em vez de renderizar eventos sintéticos caros.

Nico Messikommer, Jiaxu Xing, Leonard Bauersfeld, Marco Cannici, Elie Aljalbout, Davide Scaramuzza2026-03-10💻 cs

FeasibleCap: Real-Time Embodiment Constraint Guidance for In-the-Wild Robot Demonstration Collection

O FeasibleCap é um sistema de coleta de dados em tempo real que fornece orientação visual e háptica sobre restrições de execução diretamente no dispositivo durante a captura de demonstrações, garantindo que os movimentos sejam viáveis para o robô-alvo sem a necessidade de hardware robótico, óculos de realidade aumentada ou modelos de dinâmica aprendidos.

Zi Yin, Fanhong Li, Yun Gui, Jia Liu2026-03-10💻 cs

AiRWeb: Using AR to Extend Web Browsing Beyond Handheld Screens

O artigo apresenta o AiRWeb, um sistema que utiliza realidade aumentada para superar as limitações de tela dos dispositivos móveis, permitindo que os usuários selecionem e projetem conteúdo web arbitrário no espaço ao seu redor de forma personalizável, demonstrando sua viabilidade e usabilidade através de um protótipo funcional e um estudo preliminar.

Mengfei Gao, Caroline Appert, Ludovic David, Emmanuel Pietriga2026-03-10💻 cs

3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification

O artigo apresenta o 3DGS-HPC, um novo framework que melhora a síntese de novas vistas e a reconstrução de cenas 3D ao mitigar distratores transitórios em ambientes reais através de uma estratégia de classificação por patches e uma métrica híbrida que integra cues fotométricas e perceptuais, superando as limitações dos métodos baseados em semântica pré-treinada.

Jiahao Chen, Yipeng Qin, Ganlong Zhao, Xin Li, Wenping Wang, Guanbin Li2026-03-10💻 cs

Fast Attention-Based Simplification of LiDAR Point Clouds for Object Detection and Classification

Este artigo propõe um método de simplificação de nuvens de pontos LiDAR baseado em atenção e aprendizado, que supera o compromisso tradicional entre velocidade e precisão ao priorizar regiões relevantes para tarefas, mantendo ou melhorando a acurácia em detecção e classificação de objetos enquanto é mais rápido que o método de amostragem por pontos mais distantes (FPS).

Z. Rozsa, Á. Madaras, Q. Wei, X. Lu, M. Golarits, H. Yuan, T. Sziranyi, R. Hamzaoui2026-03-10💻 cs

VB-NET: A physics-constrained gray-box deep learning framework for modeling air conditioning systems as virtual batteries

Este artigo apresenta o VB-NET, uma estrutura de aprendizado profundo cinza-construída e baseada em física que transforma sistemas de ar condicionado em modelos de "bateria virtual" padronizados, superando modelos de caixa-preta convencionais ao garantir consistência física e alcançar alta precisão com dados históricos mínimos.

Yuchen Qi, Ye Guo, Yinliang Xu2026-03-10💻 cs

EmbedTalk: Triplane-Free Talking Head Synthesis using Embedding-Driven Gaussian Deformation

O artigo apresenta o EmbedTalk, um método de síntese de cabeças falantes que substitui as tradicionais triplas por embeddings aprendidos para deformação de Gaussians 3D, resultando em modelos mais compactos, com qualidade superior de renderização e sincronização labial, capazes de operar em tempo real (acima de 60 FPS) em GPUs móveis.

Arpita Saggar, Jonathan C. Darling, Duygu Sarikaya, David C. Hogg2026-03-10💻 cs

Beyond Semantic Similarity: Open Challenges for Embedding-Based Creative Process Analysis Across AI Design Tools

O artigo argumenta que a análise de processos criativos baseada apenas em similaridade semântica de embeddings é insuficiente para capturar dinâmicas criativas reais, identificando desafios na medição de significância criativa, no tratamento de traços multimodais e na avaliação de sistemas agênticos, propondo intervenções contextuais com modelos de linguagem para superar essas limitações.

Seung Won Lee, Semin Jin, Kyung Hoon Hyun2026-03-10💻 cs