Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

O artigo apresenta o DIRECTER, um novo método de direcionamento de ativação que utiliza um loop de decodificação guiado por plausibilidade e uma análise de sensibilidade leve para modular dinamicamente a força do direcionamento, melhorando significativamente a capacidade de seguir instruções de modelos de linguagem sem comprometer a qualidade do texto ou a fidelidade da tarefa.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

Este artigo propõe e valida autoencoders e autoencoders variacionais híbridos quântico-clássicos baseados em Representação Neural Implícita Quântica (QINR), demonstrando que essa arquitetura supera modelos como QGANs na geração e reconstrução de imagens ao produzir detalhes nítidos e maior diversidade com poucos parâmetros e dados.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

O artigo propõe o método ICD3, uma abordagem de detecção de mudança de conceito baseada em descritores de cluster imparciais que identifica e monitora individualmente conceitos minoritários em dados desbalanceados, superando o efeito de mascaramento causado por grandes clusters e oferecendo alta interpretabilidade.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Este artigo propõe e valida um quadro de explicabilidade multi-nível que demonstra a robustez e a consistência das explicações SHAP em modelos de machine learning para diagnóstico e prognóstico da Doença de Alzheimer, utilizando dados do NACC para confirmar que marcadores cognitivos e funcionais dominam as previsões com estabilidade entre diferentes estágios da doença e tarefas clínicas.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Este artigo propõe um método de colocalização adaptativa e diversificada para Redes Neurais Informadas por Física (PINNs), formulando a seleção de pontos como um problema de otimização QUBO/BQM esparsa com âncoras híbridas para construir um conjunto de núcleo (coreset) que equilibra a importância do resíduo e a diversidade espacial-temporal, resultando em maior precisão e eficiência computacional na solução da equação de Burgers viscosa.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

Este estudo desenvolve um framework de aprendizado de máquina para prever o fluxo em regime permanente em meios porosos, demonstrando que o Operador de Rede de Fourier (FNO) supera os modelos AE e U-Net ao oferecer previsões precisas e até 1000 vezes mais rápidas que a CFD tradicional, sendo ideal para otimização topológica de placas frias.

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

Este artigo propõe uma arquitetura que combina redes neurais de grafos convolucionais com metaaprendizado para permitir que modelos de atribuição de tráfego se adaptem rapidamente a redes viárias alteradas e padrões de demanda inéditos, superando as limitações de desempenho em cenários de interrupções extremas.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Este artigo investiga a aplicação da aprendizagem simbólica para a deteção de falhas no processo de oxidação de etileno, demonstrando que este método supera abordagens baseadas em redes neurais em precisão e interpretabilidade, superando a escassez de dados reais através da simulação e propondo a integração desses modelos em agentes de apoio à decisão para operadores de plantas químicas.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

O artigo propõe o HGT-Scheduler, um framework de aprendizado por reforço que utiliza Transformers de Grafos Heterogêneos para modelar o Problema de Programação de Oficinas (JSSP) preservando a semântica distinta das arestas de precedência e contenção, demonstrando superioridade estatística sobre abordagens homogêneas em instâncias de benchmark como o FT06.

Bulent Soykan2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artigo propõe um modelo de difusão informado por física baseado na arquitetura Context-UNet para gerar dados sintéticos de eventos climáticos extremos e raros, superando a escassez de amostras e o desequilíbrio de classes que limitam o desenvolvimento de modelos de aprendizado de máquina robustos para a detecção de ciclones tropicais.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

O artigo apresenta o Best-of-Tails (BoT), um novo framework de alinhamento em tempo de inferência que utiliza a estimativa da cauda da distribuição de recompensas para adaptar dinamicamente a estratégia de seleção entre otimismo e pessimismo, superando as limitações de métodos fixos ao equilibrar a exploração de respostas de alta qualidade com a mitigação de erros de recompensa.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

O NEST é um framework de placemento de dispositivos para aprendizado profundo distribuído que unifica o paralelismo de modelo, a modelagem de topologia de rede e a viabilidade de memória através de programação dinâmica estruturada, resultando em melhorias significativas de throughput e eficiência em comparação com métodos anteriores.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG