Free Lunch for Pass@kk? Low Cost Diverse Sampling for Diffusion Language Models

Os autores propõem uma intervenção de baixo custo e sem necessidade de re-treinamento para modelos de linguagem difusivos, que modifica sequencialmente amostras intermediárias para repelir redundâncias no espaço de características, resultando em maior diversidade e melhor desempenho Pass@kk em tarefas complexas como geração de código e resolução de problemas matemáticos.

Sean Lamont, Christian Walder, Paul Montague + 2 more2026-03-06🤖 cs.AI

Authorize-on-Demand: Dynamic Authorization with Legality-Aware Intellectual Property Protection for VLMs

O artigo propõe o framework AoD-IP, uma solução inovadora para proteção de propriedade intelectual em Modelos Visão-Linguagem (VLMs) que permite autorização dinâmica sob demanda e avaliação de legalidade, superando as limitações de métodos estáticos ao oferecer controle flexível ao usuário e detecção confiável de acessos não autorizados em ambientes dinâmicos.

Lianyu Wang, Meng Wang, Huazhu Fu + 1 more2026-03-06🤖 cs.AI

EvoTool: Self-Evolving Tool-Use Policy Optimization in LLM Agents via Blame-Aware Mutation and Diversity-Aware Selection

O artigo apresenta o EvoTool, um framework autoevolutivo que otimiza a política de uso de ferramentas em agentes LLM através de um paradigma evolutivo sem gradiente, utilizando atribuição de culpa baseada em trajetórias, mutação direcionada por feedback e seleção consciente da diversidade para superar limitações de otimização monolítica e de aspectos únicos.

Shuo Yang, Soyeon Caren Han, Xueqi Ma + 3 more2026-03-06🤖 cs.AI

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

O artigo apresenta o AgentSCOPE, um benchmark e framework baseado em Integridade Contextual que avalia fluxos de dados intermediários em sistemas agênticos, revelando que a maioria das violações de privacidade ocorre durante as respostas das ferramentas e é frequentemente ignorada pelas avaliações focadas apenas na saída final.

Ivoline C. Ngong, Keerthiram Murugesan, Swanand Kadhe, Justin D. Weisz, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy2026-03-06🔒 cs.CR

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

Este artigo demonstra que as intervenções de alinhamento em modelos de linguagem, embora eficazes em inglês, podem gerar um "efeito colateral de alinhamento" que inverte a segurança e amplifica patologias coletivas em outros idiomas, revelando que a eficácia da segurança é estruturalmente determinada pelo espaço linguístico e cultural e não se transfere universalmente.

Hiroki Fukui2026-03-06🤖 cs.AI

Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records

Este artigo descreve um fluxo de trabalho determinístico e baseado em regras, implementado no script `cad_processor.py`, que processa extratos administrativos para calcular e relatar custos por aluno, agregando dados por escola e ano e aplicando uma camada de bandagem fuzzy interpretável para classificar os custos como baixos, médios ou altos com total rastreabilidade e reprodutibilidade.

Shane Lee, Stella Ng2026-03-06🤖 cs.AI

Knowledge-informed Bidding with Dual-process Control for Online Advertising

O artigo propõe o KBD, um método inovador de otimização de lances para publicidade online que supera as limitações dos modelos de caixa-preta ao integrar expertise humana como viés indutivo, utilizar o Decision Transformer para otimização global de sequências e empregar um controle de duplo processo que combina regras PID rápidas com tomada de decisão estratégica.

Huixiang Luo, Longyu Gao, Yaqi Liu + 3 more2026-03-06🤖 cs.AI

Retrieval-Augmented Generation with Covariate Time Series

O artigo apresenta o RAG4CTS, um framework de geração aumentada por recuperação sem treinamento e consciente de regimes para séries temporais com covariáveis, que supera as limitações existentes em cenários de escassez de dados e dinâmica acoplada, demonstrando alta precisão e zero falsos alarmes na manutenção preditiva de válvulas PRSOV da China Southern Airlines.

Kenny Ye Liang, Zhongyi Pei, Huan Zhang + 3 more2026-03-06🤖 cs.AI