cs.AI artigos | Gist.Science

Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation

Este artigo avalia técnicas de elicitação de honestidade e detecção de mentiras em modelos de linguagem abertos chineses que censuram tópicos politicamente sensíveis, descobrindo que métodos como amostragem sem template de chat e prompts de few-shot aumentam respostas verdadeiras, embora nenhuma técnica elimine completamente as falsidades.

Helena Casademunt, Bartosz Cywiński, Khoi Tran + 3 more2026-03-06🤖 cs.AI

The Spike, the Sparse and the Sink: Anatomy of Massive Activations and Attention Sinks

Este artigo demonstra que as ativações massivas e os sumidouros de atenção, embora frequentemente co-ocorram devido a artefatos arquitetônicos como a configuração pré-norm, desempenham funções distintas e separáveis nos modelos Transformer: as primeiras atuam globalmente como parâmetros implícitos, enquanto os segundos operam localmente para modular a atenção.

Shangwen Sun, Alfredo Canziani, Yann LeCun + 1 more2026-03-06🤖 cs.AI

POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation

O POET-X é uma variante escalável e eficiente em termos de memória do framework POET que, ao otimizar transformações de equivalência ortogonal com custo computacional reduzido, permite o pré-treinamento de modelos de linguagem de bilhões de parâmetros em uma única GPU, superando as limitações de memória de otimizadores padrão como o AdamW.

Zeju Qiu, Lixin Liu, Adrian Weller + 2 more2026-03-06🤖 cs.AI

RoboPocket: Improve Robot Policies Instantly with Your Phone

O RoboPocket é um sistema portátil que utiliza realidade aumentada em smartphones para permitir a iteração instantânea de políticas robóticas sem a necessidade de um robô físico, identificando falhas proativamente e refinando o modelo em tempo real, o que duplica a eficiência de dados em comparação com estratégias offline.

Junjie Fang, Wendi Chen, Han Xue + 7 more2026-03-06🤖 cs.AI

Recurrent Action Transformer with Memory

O artigo propõe o Recurrent Action Transformer with Memory (RATE), uma nova arquitetura baseada em transformers que integra um mecanismo de memória recorrente para superar as limitações de contexto em ambientes parcialmente observáveis, demonstrando desempenho superior em tarefas dependentes de memória e competitividade em benchmarks padrão de RL offline.

Egor Cherepanov, Alexey Staroverov, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

Catch Me If You Can Describe Me: Open-Vocabulary Camouflaged Instance Segmentation with Diffusion

Este artigo propõe um novo método para segmentação de instâncias camufladas em vocabulário aberto, utilizando técnicas de difusão texto-para-imagem para aprender representações visuais e textuais multiescala que superam as limitações atuais na identificação de objetos que se fundem ao fundo, abrindo caminho para aplicações em vigilância, monitoramento da vida selvagem e reconhecimento militar.

Tuan-Anh Vu, Duc Thanh Nguyen, Qing Guo + 4 more2026-03-05🤖 cs.AI

Learning to Generate Conditional Tri-plane for 3D-aware Expression Controllable Portrait Animation

O artigo apresenta o Export3D, um método de animação de retratos em uma única imagem que gera um tri-plano condicional 3D-aware para controlar expressões faciais e ângulos de câmera sem trocar a aparência do sujeito, graças a um novo quadro de pré-treinamento contrastivo que isola os parâmetros de expressão dos traços de identidade.

Taekyung Ki, Dongchan Min, Gyeongsu Chae2026-03-05🤖 cs.AI

A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving

Este artigo revisa as funções de recompensa para aprendizado por reforço no contexto de direção autônoma, categorizando objetivos como segurança, conforto, progresso e conformidade com regras de trânsito, identificando limitações como a falta de padronização e a incapacidade de lidar com contextos, e propondo futuras direções de pesquisa para criar recompensas estruturadas, conscientes do contexto e validadas.

Ahmed Abouelazm, Jonas Michel, J. Marius Zoellner2026-03-05🤖 cs.AI

Leveraging Large Language Models for Semantic Query Processing in a Scholarly Knowledge Graph

Este trabalho propõe um sistema inovador de processamento de consultas semânticas que integra Modelos de Linguagem de Grande Escala (LLMs) ao Grafo de Conhecimento Acadêmico da ANU, utilizando o Modelo de Documento Profundo (DDM) e o Processamento de Consultas Aprimorado por KG (KGQP) para superar as limitações das abordagens tradicionais e permitir a recuperação precisa e eficiente de informações detalhadas sobre a pesquisa em Ciência da Computação.

Runsong Jia, Bowen Zhang, Sergio J. Rodríguez Méndez + 1 more2026-03-05🤖 cs.AI

Merlin: A Computed Tomography Vision-Language Foundation Model and Dataset

O artigo apresenta o Merlin, um modelo fundacional de linguagem e visão 3D treinado em um vasto conjunto de dados clínicos de tomografias computadorizadas abdominais, registros eletrônicos de saúde e laudos radiológicos, que supera os modelos existentes na interpretação de imagens médicas e demonstra alta generalização em diversas tarefas diagnósticas, prognósticas e de qualidade.

Louis Blankemeier, Ashwin Kumar, Joseph Paul Cohen + 37 more2026-03-05🤖 cs.AI

A Bayesian Framework for Active Tactile Object Recognition, Pose Estimation and Shape Transfer Learning

Este artigo apresenta um framework bayesiano unificado que combina um filtro de partículas personalizado e superfícies implícitas de processos gaussianos para permitir que robôs realizem reconhecimento ativo de objetos, estimativa de pose e transferência de aprendizado de formas, utilizando exploração guiada para adquirir dados e reconstruir objetos novos com base no conhecimento prévio.

Haodong Zheng, Andrei Jalba, Raymond H. Cuijpers + 2 more2026-03-05🤖 cs.AI

Conjuring Semantic Similarity

O artigo propõe uma nova abordagem para medir a similaridade semântica entre expressões textuais baseada nas imagens que elas evocam, calculando a distância entre as distribuições de imagens geradas por modelos difusivos através da divergência de Jeffreys, o que resulta em métricas alinhadas com avaliações humanas e oferece maior interpretabilidade.

Tian Yu Liu, Stefano Soatto2026-03-05🤖 cs.AI

Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration

Este artigo propõe o OVMSE, um novo framework de Aprendizado por Reforço Multiagente Offline-para-Online que utiliza Memória de Função de Valor Offline e Exploração Sequencial para mitigar o esquecimento de conhecimento pré-treinado e otimizar a exploração em espaços de estado-ação conjuntos, demonstrando desempenho superior em eficiência de amostras e resultados no desafio StarCraft Multi-Agent.

Hai Zhong, Xun Wang, Zhuoran Li + 1 more2026-03-05🤖 cs.AI

Toward Reasoning on the Boundary: A Mixup-based Approach for Graph Anomaly Detection

O artigo apresenta o ANOMIX, uma abordagem baseada em mixup que sintetiza negativos difíceis ao interpolar representações de subgrafos normais e anômalos, superando as limitações dos métodos atuais na detecção de anomalias de fronteira camufladas em grafos.

Hwan Kim, Junghoon Kim, Sungsu Lim2026-03-05🤖 cs.AI

Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups

Este artigo propõe o CeGDRO, uma abordagem que integra Aprendizado de Currículo ao GroupDRO para inicializar os pesos do modelo de forma imparcial e priorizar amostras desafiadoras, superando os métodos atuais de estado da arte em cenários de deslocamento de subpopulação.

Antonio Barbalau2026-03-05🤖 cs.AI

Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation

Este artigo propõe definições precisas de memória para agentes de Aprendizado por Reforço, inspiradas na ciência cognitiva, e estabelece uma metodologia padronizada para classificar e avaliar objetivamente suas capacidades de memória, demonstrando empiricamente a importância de seguir esse protocolo para evitar julgamentos equivocados.

Egor Cherepanov, Nikita Kachaev, Artem Zholus + 2 more2026-03-05🤖 cs.AI

LMUnit: Fine-grained Evaluation with Natural Language Unit Tests

O artigo apresenta o LMUnit, um modelo de avaliação unificado que utiliza testes unitários em linguagem natural para decompor a qualidade das respostas, demonstrando melhor concordância entre anotadores e desempenho superior em benchmarks comparado aos métodos tradicionais.

Jon Saad-Falcon, Rajan Vivek, William Berrios + 6 more2026-03-05🤖 cs.AI

Difficult Examples Hurt Unsupervised Contrastive Learning: A Theoretical Perspective

Este artigo demonstra, através de uma análise teórica e validação empírica, que a remoção de exemplos difíceis, juntamente com o ajuste de margens e escalonamento de temperatura, melhora os limites de generalização e o desempenho de classificação em aprendizado contrastivo não supervisionado, ao contrário do que ocorre no aprendizado supervisionado.

Yi-Ge Zhang, Jingyi Cui, Qiran Li + 1 more2026-03-05🤖 cs.AI

Preference Leakage: A Contamination Problem in LLM-as-a-judge

Este trabalho identifica e demonstra empiricamente o "vazamento de preferências", um problema de contaminação e viés em que modelos de linguagem atuando como juízes tendem a favorecer modelos geradores de dados sintéticos com os quais compartilham relação de origem, família ou identidade.

Dawei Li, Renliang Sun, Yue Huang + 6 more2026-03-05🤖 cs.AI

DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability

O artigo apresenta o DCENWCNet, uma nova rede neural convolucional emsemble que integra três arquiteturas CNN com configurações distintas para superar os desafios de desequilíbrio de dados na classificação de glóbulos brancos, alcançando desempenho superior em métricas de precisão e incorporando a técnica LIME para garantir a interpretabilidade e confiança nas previsões de diagnóstico automatizado.

Sibasish Dhibar2026-03-05🤖 cs.AI

← Anterior Próximo →