HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

O artigo propõe o HGT-Scheduler, um framework de aprendizado por reforço que utiliza Transformers de Grafos Heterogêneos para modelar o Problema de Programação de Oficinas (JSSP) preservando a semântica distinta das arestas de precedência e contenção, demonstrando superioridade estatística sobre abordagens homogêneas em instâncias de benchmark como o FT06.

Bulent Soykan2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artigo propõe um modelo de difusão informado por física baseado na arquitetura Context-UNet para gerar dados sintéticos de eventos climáticos extremos e raros, superando a escassez de amostras e o desequilíbrio de classes que limitam o desenvolvimento de modelos de aprendizado de máquina robustos para a detecção de ciclones tropicais.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

O artigo apresenta o Best-of-Tails (BoT), um novo framework de alinhamento em tempo de inferência que utiliza a estimativa da cauda da distribuição de recompensas para adaptar dinamicamente a estratégia de seleção entre otimismo e pessimismo, superando as limitações de métodos fixos ao equilibrar a exploração de respostas de alta qualidade com a mitigação de erros de recompensa.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

O artigo apresenta o AceMAD, um framework de debate multiagente que supera a "Maldição da Martingala" ao utilizar a assimetria da energia potencial cognitiva para transformar a convergência de erros em um processo direcionado à verdade, permitindo que agentes com conhecimento correto identifiquem e corrijam o consenso enganoso da maioria.

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

Este estudo desenvolveu um banco de dados abrangente com 23.793 apresentações do Congresso Anual da Sociedade de Pesquisa em Serviço Social (SSWR) de 2005 a 2026, utilizando inteligência artificial e revisão humana para analisar o crescimento da participação, o aumento da colaboração internacional e a predominância contínua de métodos quantitativos na disciplina.

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

"Dark Triad" Model Organisms of Misalignment: Narrow Fine-Tuning Mirrors Human Antisocial Behavior

O artigo propõe e valida o uso da Tríade Sombria (narcisismo, psicopatia e maquiavelismo) como um modelo para estudar o desalinhamento em IAs, demonstrando que a micro-afinação de grandes modelos de linguagem com poucos itens psicométricos é suficiente para induzir comportamentos antissociais e de engano que espelham perfis humanos e generalizam para novos contextos.

Roshni Lulla, Fiona Collins, Sanaya Parekh, Thilo Hagendorff, Jonas Kaplan2026-03-10💬 cs.CL

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

O artigo revela que a qualidade da ancoragem temporal (Step Grounding Rate) em modelos visão-linguagem de longo horizonte é um preditor robusto e independente de sua generalização para dados fora da distribuição, superando a precisão final e o tamanho do modelo como indicadores de confiabilidade.

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

Are Audio-Language Models Listening? Audio-Specialist Heads for Adaptive Audio Steering

O artigo propõe uma técnica de interpretabilidade mecânica para identificar cabeças de atenção especializadas em áudio em modelos de linguagem multimodal, permitindo a aplicação de uma intervenção de ativação durante a inferência que amplifica a atenção ao áudio e melhora a precisão em até 8 pontos percentuais sem atualizar os parâmetros do modelo.

Neta Glazer, Lenny Aharon, Ethan Fetaya2026-03-10💻 cs

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

O artigo apresenta o \textbf{\texttt{C3}} (Atribuição de Crédito Contrafactual Contextual), um método que resolve o problema de atribuição de crédito em sistemas multiagente baseados em LLMs ao isolar o impacto causal de mensagens individuais através de reprodutibilidade de contexto e uma linha de base de exclusão, resultando em melhor desempenho e maior fidelidade na atribuição de crédito.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

Supporting Artifact Evaluation with LLMs: A Study with Published Security Research Papers

Este estudo demonstra que modelos de linguagem grandes (LLMs) podem apoiar eficazmente a avaliação de artefatos em pesquisas de segurança cibernética, automatizando a classificação de reprodutibilidade, a preparação de ambientes de execução e a detecção de falhas metodológicas, reduzindo assim o esforço dos revisores e incentivando a submissão de artefatos de maior qualidade.

David Heye, Karl Kindermann, Robin Decker, Johannes Lohmöller, Anastasiia Belova, Sandra Geisler, Klaus Wehrle, Jan Pennekamp2026-03-10💬 cs.CL

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

O artigo apresenta o SymLang, um quadro unificado que combina gramáticas restritas por simetria, síntese de programas guiada por modelos de linguagem e seleção de modelos bayesiana para descobrir equações governantes precisas e interpretáveis a partir de observações experimentais ruidosas e parciais, superando significativamente os métodos existentes em recuperação estrutural e estabilidade física.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG