cs.AI artigos | Gist.Science

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

O artigo propõe o HGT-Scheduler, um framework de aprendizado por reforço que utiliza Transformers de Grafos Heterogêneos para modelar o Problema de Programação de Oficinas (JSSP) preservando a semântica distinta das arestas de precedência e contenção, demonstrando superioridade estatística sobre abordagens homogêneas em instâncias de benchmark como o FT06.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

O artigo apresenta o SpatialMAGIC, um modelo híbrido inovador que integra difusão em grafos e atenção espacial para imputar dados de transcriptômica espacial, superando métodos existentes na redução de ruído e esparsidade enquanto preserva a arquitetura tecidual e melhora a interpretação biológica.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

O artigo apresenta o *xaitimesynth*, um pacote Python de código aberto que fornece infraestrutura reutilizável para avaliar métodos de atribuição em séries temporais, gerando dados sintéticos com verdade fundamental conhecida e métricas padronizadas de localização.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artigo propõe um modelo de difusão informado por física baseado na arquitetura Context-UNet para gerar dados sintéticos de eventos climáticos extremos e raros, superando a escassez de amostras e o desequilíbrio de classes que limitam o desenvolvimento de modelos de aprendizado de máquina robustos para a detecção de ciclones tropicais.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

O artigo apresenta a Regularização de Política Otimista (OPR), um mecanismo leve que preserva trajetórias historicamente bem-sucedidas para evitar a convergência prematura em aprendizado por reforço profundo, demonstrando ganhos significativos em eficiência de amostras e desempenho final em ambientes como Atari e CAGE Challenge 2.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

O artigo apresenta o Best-of-Tails (BoT), um novo framework de alinhamento em tempo de inferência que utiliza a estimativa da cauda da distribuição de recompensas para adaptar dinamicamente a estratégia de seleção entre otimismo e pessimismo, superando as limitações de métodos fixos ao equilibrar a exploração de respostas de alta qualidade com a mitigação de erros de recompensa.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

O artigo apresenta o AceMAD, um framework de debate multiagente que supera a "Maldição da Martingala" ao utilizar a assimetria da energia potencial cognitiva para transformar a convergência de erros em um processo direcionado à verdade, permitindo que agentes com conhecimento correto identifiquem e corrijam o consenso enganoso da maioria.

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Este artigo apresenta um modelo híbrido de aprendizado de máquina que combina três CNNs (VGG19, Efficient-Net e ResNet50) com um classificador Bi-LSTM para detectar Cerebral Palsy em imagens de ressonância magnética de recém-nascidos, alcançando uma precisão de 98,83% superior a modelos pré-existentes.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Making AI Evaluation Deployment Relevant Through Context Specification

O artigo propõe a "especificação de contexto" como um processo fundamental para transformar perspectivas difusas das partes interessadas em definições claras e mensuráveis, permitindo que as organizações avaliem e decidam sobre a implementação de IA de forma mais informada e alinhada às realidades operacionais.

Matthew Holmes, Thiago Lacerda, Reva Schwartz2026-03-10💻 cs

Reinforcing the World's Edge: A Continual Learning Problem in the Multi-Agent-World Boundary

Este artigo propõe que o aprendizado contínuo em sistemas multiagente descentralizados surge da instabilidade da fronteira entre agente e mundo, onde atualizações de políticas geram não-estacionariedade que pode destruir estruturas de decisão invariantes essenciais para o sucesso da tarefa.

Dane Malenfant2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

Este estudo desenvolveu um banco de dados abrangente com 23.793 apresentações do Congresso Anual da Sociedade de Pesquisa em Serviço Social (SSWR) de 2005 a 2026, utilizando inteligência artificial e revisão humana para analisar o crescimento da participação, o aumento da colaboração internacional e a predominância contínua de métodos quantitativos na disciplina.

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

"Dark Triad" Model Organisms of Misalignment: Narrow Fine-Tuning Mirrors Human Antisocial Behavior

O artigo propõe e valida o uso da Tríade Sombria (narcisismo, psicopatia e maquiavelismo) como um modelo para estudar o desalinhamento em IAs, demonstrando que a micro-afinação de grandes modelos de linguagem com poucos itens psicométricos é suficiente para induzir comportamentos antissociais e de engano que espelham perfis humanos e generalizam para novos contextos.

Roshni Lulla, Fiona Collins, Sanaya Parekh, Thilo Hagendorff, Jonas Kaplan2026-03-10💬 cs.CL

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

O artigo revela que a qualidade da ancoragem temporal (Step Grounding Rate) em modelos visão-linguagem de longo horizonte é um preditor robusto e independente de sua generalização para dados fora da distribuição, superando a precisão final e o tamanho do modelo como indicadores de confiabilidade.

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

Twitch: Learning Abstractions for Equational Theorem Proving

O artigo apresenta o Twitch, uma ferramenta que descobre automaticamente abstrações (padrões de termos recorrentes) a partir de provas parciais ou bem-sucedidas para auxiliar o provador de teoremas equacionais Twee, resultando na prova de problemas de dificuldade rating-1 e em acelerações significativas em outros.

Guy Axelrod, Moa Johansson, Nicholas Smallbone2026-03-10💻 cs

Are Audio-Language Models Listening? Audio-Specialist Heads for Adaptive Audio Steering

O artigo propõe uma técnica de interpretabilidade mecânica para identificar cabeças de atenção especializadas em áudio em modelos de linguagem multimodal, permitindo a aplicação de uma intervenção de ativação durante a inferência que amplifica a atenção ao áudio e melhora a precisão em até 8 pontos percentuais sem atualizar os parâmetros do modelo.

Neta Glazer, Lenny Aharon, Ethan Fetaya2026-03-10💻 cs

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

O artigo apresenta o \textbf{\texttt{C3}} (Atribuição de Crédito Contrafactual Contextual), um método que resolve o problema de atribuição de crédito em sistemas multiagente baseados em LLMs ao isolar o impacto causal de mensagens individuais através de reprodutibilidade de contexto e uma linha de base de exclusão, resultando em melhor desempenho e maior fidelidade na atribuição de crédito.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

Supporting Artifact Evaluation with LLMs: A Study with Published Security Research Papers

Este estudo demonstra que modelos de linguagem grandes (LLMs) podem apoiar eficazmente a avaliação de artefatos em pesquisas de segurança cibernética, automatizando a classificação de reprodutibilidade, a preparação de ambientes de execução e a detecção de falhas metodológicas, reduzindo assim o esforço dos revisores e incentivando a submissão de artefatos de maior qualidade.

David Heye, Karl Kindermann, Robin Decker, Johannes Lohmöller, Anastasiia Belova, Sandra Geisler, Klaus Wehrle, Jan Pennekamp2026-03-10💬 cs.CL

A prior information informed learning architecture for flying trajectory prediction

Este artigo apresenta um novo framework de aprendizado eficiente em hardware para previsão de trajetórias de voo, que integra informações prévias ambientais a uma arquitetura de Transformer em cascata dupla (DTC) para prever com precisão pontos de aterrissagem, como demonstrado na trajetória de bolas de tênis.

Xianda Huang, Zidong Han, Ruibo Jin, Zhenyu Wang, Wenyu Li, Xiaoyang Li, Yi Gong2026-03-10💻 cs

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

O artigo apresenta o SymLang, um quadro unificado que combina gramáticas restritas por simetria, síntese de programas guiada por modelos de linguagem e seleção de modelos bayesiana para descobrir equações governantes precisas e interpretáveis a partir de observações experimentais ruidosas e parciais, superando significativamente os métodos existentes em recuperação estrutural e estabilidade física.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

LEAD: Breaking the No-Recovery Bottleneck in Long-Horizon Reasoning

O artigo propõe o método LEAD (Lookahead-Enhanced Atomic Decomposition), que supera o gargalo de não-recuperação em raciocínio de longo horizonte ao combinar validação futura de curto prazo e agregação de execuções sobrepostas, permitindo que modelos como o o4-mini resolvam problemas complexos de salto de damas com maior estabilidade do que as decomposições extremas.

Denys Pushkin, Emmanuel Abbe2026-03-10💻 cs

← Anterior Próximo →