The Spike, the Sparse and the Sink: Anatomy of Massive Activations and Attention Sinks

Este artigo demonstra que as ativações massivas e os sumidouros de atenção, embora frequentemente co-ocorram devido a artefatos arquitetônicos como a configuração pré-norm, desempenham funções distintas e separáveis nos modelos Transformer: as primeiras atuam globalmente como parâmetros implícitos, enquanto os segundos operam localmente para modular a atenção.

Shangwen Sun, Alfredo Canziani, Yann LeCun + 1 more2026-03-06🤖 cs.AI

Catch Me If You Can Describe Me: Open-Vocabulary Camouflaged Instance Segmentation with Diffusion

Este artigo propõe um novo método para segmentação de instâncias camufladas em vocabulário aberto, utilizando técnicas de difusão texto-para-imagem para aprender representações visuais e textuais multiescala que superam as limitações atuais na identificação de objetos que se fundem ao fundo, abrindo caminho para aplicações em vigilância, monitoramento da vida selvagem e reconhecimento militar.

Tuan-Anh Vu, Duc Thanh Nguyen, Qing Guo + 4 more2026-03-05🤖 cs.AI

Learning to Generate Conditional Tri-plane for 3D-aware Expression Controllable Portrait Animation

O artigo apresenta o Export3D, um método de animação de retratos em uma única imagem que gera um tri-plano condicional 3D-aware para controlar expressões faciais e ângulos de câmera sem trocar a aparência do sujeito, graças a um novo quadro de pré-treinamento contrastivo que isola os parâmetros de expressão dos traços de identidade.

Taekyung Ki, Dongchan Min, Gyeongsu Chae2026-03-05🤖 cs.AI

A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving

Este artigo revisa as funções de recompensa para aprendizado por reforço no contexto de direção autônoma, categorizando objetivos como segurança, conforto, progresso e conformidade com regras de trânsito, identificando limitações como a falta de padronização e a incapacidade de lidar com contextos, e propondo futuras direções de pesquisa para criar recompensas estruturadas, conscientes do contexto e validadas.

Ahmed Abouelazm, Jonas Michel, J. Marius Zoellner2026-03-05🤖 cs.AI

Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph

Este trabalho propõe um sistema inovador de processamento de consultas semânticas que integra Modelos de Linguagem de Grande Escala (LLMs) ao Grafo de Conhecimento Acadêmico da ANU, utilizando o Modelo de Documento Profundo (DDM) e o Processamento de Consultas Aprimorado por KG (KGQP) para superar as limitações das abordagens tradicionais e permitir a recuperação precisa e eficiente de informações detalhadas sobre a pesquisa em Ciência da Computação.

Runsong Jia, Bowen Zhang, Sergio J. Rodríguez Méndez + 1 more2026-03-05🤖 cs.AI

Merlin: A Computed Tomography Vision-Language Foundation Model and Dataset

O artigo apresenta o Merlin, um modelo fundacional de linguagem e visão 3D treinado em um vasto conjunto de dados clínicos de tomografias computadorizadas abdominais, registros eletrônicos de saúde e laudos radiológicos, que supera os modelos existentes na interpretação de imagens médicas e demonstra alta generalização em diversas tarefas diagnósticas, prognósticas e de qualidade.

Louis Blankemeier, Ashwin Kumar, Joseph Paul Cohen + 37 more2026-03-05🤖 cs.AI

A Bayesian Framework for Active Tactile Object Recognition, Pose Estimation and Shape Transfer Learning

Este artigo apresenta um framework bayesiano unificado que combina um filtro de partículas personalizado e superfícies implícitas de processos gaussianos para permitir que robôs realizem reconhecimento ativo de objetos, estimativa de pose e transferência de aprendizado de formas, utilizando exploração guiada para adquirir dados e reconstruir objetos novos com base no conhecimento prévio.

Haodong Zheng, Andrei Jalba, Raymond H. Cuijpers + 2 more2026-03-05🤖 cs.AI

Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration

Este artigo propõe o OVMSE, um novo framework de Aprendizado por Reforço Multiagente Offline-para-Online que utiliza Memória de Função de Valor Offline e Exploração Sequencial para mitigar o esquecimento de conhecimento pré-treinado e otimizar a exploração em espaços de estado-ação conjuntos, demonstrando desempenho superior em eficiência de amostras e resultados no desafio StarCraft Multi-Agent.

Hai Zhong, Xun Wang, Zhuoran Li + 1 more2026-03-05🤖 cs.AI

Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation

Este artigo propõe definições precisas de memória para agentes de Aprendizado por Reforço, inspiradas na ciência cognitiva, e estabelece uma metodologia padronizada para classificar e avaliar objetivamente suas capacidades de memória, demonstrando empiricamente a importância de seguir esse protocolo para evitar julgamentos equivocados.

Egor Cherepanov, Nikita Kachaev, Artem Zholus + 2 more2026-03-05🤖 cs.AI

Difficult Examples Hurt Unsupervised Contrastive Learning: A Theoretical Perspective

Este artigo demonstra, através de uma análise teórica e validação empírica, que a remoção de exemplos difíceis, juntamente com o ajuste de margens e escalonamento de temperatura, melhora os limites de generalização e o desempenho de classificação em aprendizado contrastivo não supervisionado, ao contrário do que ocorre no aprendizado supervisionado.

Yi-Ge Zhang, Jingyi Cui, Qiran Li + 1 more2026-03-05🤖 cs.AI

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

O artigo apresenta o DCENWCNet, uma nova rede neural convolucional emsemble que integra três arquiteturas CNN com configurações distintas para superar os desafios de desequilíbrio de dados na classificação de glóbulos brancos, alcançando desempenho superior em métricas de precisão e incorporando a técnica LIME para garantir a interpretabilidade e confiança nas previsões de diagnóstico automatizado.

Sibasish Dhibar2026-03-05🤖 cs.AI