Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

O artigo utiliza técnicas de interpretabilidade mecânica para revelar que, em modelos VideoViT pré-treinados, a representação causal de resultados de ações humanas (sucesso vs. falha) é gerada por um circuito distribuído e redundante onde os mecanismos de atenção atuam como coletores de evidências e os blocos MLP como compositores de conceitos, demonstrando que modelos de classificação podem desenvolver "conhecimento oculto" sofisticado que exige supervisão mecânica para garantir AI confiável.

Sai V R Chereddy2026-03-13🤖 cs.LG

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

Este artigo estabelece uma análise sistemática de leis de escala para ataques de jailbreak em modelos de linguagem grandes, demonstrando que métodos baseados em prompt são mais eficientes computacionalmente e alcançam maior sucesso e sigilo do que abordagens de otimização, além de revelar que a vulnerabilidade varia significativamente dependendo do tipo de dano pretendido.

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran2026-03-13🤖 cs.LG

Huntington Disease Automatic Speech Recognition with Biomarker Supervision

Este artigo apresenta um estudo sistemático de reconhecimento automático de fala para a doença de Huntington, demonstrando que a adaptação específica da doença e o uso de supervisão auxiliar baseada em biomarcadores reduzem significativamente a taxa de erro, ao mesmo tempo em que revela padrões de erro distintos dependentes da gravidade da condição.

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG

Bayesian Optimization of Partially Known Systems using Hybrid Models

Este artigo propõe uma abordagem de otimização bayesiana híbrida que integra modelos mecanísticos de física conhecidos com modelos probabilísticos para variáveis desconhecidas, demonstrando em simulações de destilação que essa estratégia converge significativamente mais rápido e produz melhores resultados do que a otimização bayesiana padrão.

Eike Cramer, Luis Kutschat, Oliver Stollenwerk, Joel A. Paulson, Alexander Mitsos2026-03-13🤖 cs.LG

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

O artigo apresenta o DNS-GT, uma abordagem inovadora baseada em Transformers que aprende representações de nomes de domínio a partir de sequências de consultas DNS, superando métodos existentes ao capturar informações contextuais e demonstrar superioridade em tarefas como classificação de domínios e detecção de botnets.

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio Sanchez2026-03-13🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

Este artigo propõe o mecanismo SCS-Code, que utiliza as representações internas dos modelos de linguagem para orientar a geração de código em direção a conceitos de segurança, superando os métodos atuais ao garantir tanto a correção funcional quanto a segurança do código gerado.

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip Sperl2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

O artigo avalia a evolução de modelos de IA autônomos em cenários de ciberataques multi-etapa, revelando que o desempenho escala log-linearmente com o poder de computação e melhora significativamente entre gerações de modelos, permitindo que os mais recentes completem uma fração substancial de ataques complexos que antes exigiriam horas de um especialista humano.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

Cough activity detection for automatic tuberculosis screening

O artigo propõe o uso de um modelo pré-treinado XLS-R, otimizado com apenas suas três primeiras camadas para eficiência computacional, que supera outras arquiteturas na detecção automática de segmentos de tosse em gravações de pacientes com suspeita de tuberculose, viabilizando assim ferramentas de triagem escaláveis para dispositivos móveis.

Joshua Jansen van Vüren, Devendra Singh Parihar, Daphne Naidoo, Kimsey Zajac, Willy Ssengooba, Grant Theron, Thomas Niesler2026-03-13⚡ eess