cs.LG artigos | Gist.Science

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

O artigo apresenta o DIRECTER, um novo método de direcionamento de ativação que utiliza um loop de decodificação guiado por plausibilidade e uma análise de sensibilidade leve para modular dinamicamente a força do direcionamento, melhorando significativamente a capacidade de seguir instruções de modelos de linguagem sem comprometer a qualidade do texto ou a fidelidade da tarefa.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

O artigo apresenta o ProtAlign, um framework de alinhamento de preferências multi-objetivo que ajusta modelos de inversão de dobramento de proteínas pré-treinados para otimizar simultaneamente diversas propriedades de desenvolvimento, como solubilidade e estabilidade, sem comprometer a fidelidade estrutural.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Este artigo propõe o LAE-EnKF, um filtro de Kalman baseado em autoencoders latentes que reformula a assimilação de dados em um espaço latente com dinâmicas lineares e estáveis, superando as limitações de não linearidade do filtro de Kalman tradicional e demonstrando maior precisão e estabilidade em sistemas caóticos.

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

Este artigo propõe e valida autoencoders e autoencoders variacionais híbridos quântico-clássicos baseados em Representação Neural Implícita Quântica (QINR), demonstrando que essa arquitetura supera modelos como QGANs na geração e reconstrução de imagens ao produzir detalhes nítidos e maior diversidade com poucos parâmetros e dados.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

O artigo propõe o método ICD3, uma abordagem de detecção de mudança de conceito baseada em descritores de cluster imparciais que identifica e monitora individualmente conceitos minoritários em dados desbalanceados, superando o efeito de mascaramento causado por grandes clusters e oferecendo alta interpretabilidade.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Este artigo propõe e valida um quadro de explicabilidade multi-nível que demonstra a robustez e a consistência das explicações SHAP em modelos de machine learning para diagnóstico e prognóstico da Doença de Alzheimer, utilizando dados do NACC para confirmar que marcadores cognitivos e funcionais dominam as previsões com estabilidade entre diferentes estágios da doença e tarefas clínicas.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Este artigo propõe um método de colocalização adaptativa e diversificada para Redes Neurais Informadas por Física (PINNs), formulando a seleção de pontos como um problema de otimização QUBO/BQM esparsa com âncoras híbridas para construir um conjunto de núcleo (coreset) que equilibra a importância do resíduo e a diversidade espacial-temporal, resultando em maior precisão e eficiência computacional na solução da equação de Burgers viscosa.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

Este estudo desenvolve um framework de aprendizado de máquina para prever o fluxo em regime permanente em meios porosos, demonstrando que o Operador de Rede de Fourier (FNO) supera os modelos AE e U-Net ao oferecer previsões precisas e até 1000 vezes mais rápidas que a CFD tradicional, sendo ideal para otimização topológica de placas frias.

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

Este artigo propõe uma arquitetura que combina redes neurais de grafos convolucionais com metaaprendizado para permitir que modelos de atribuição de tráfego se adaptem rapidamente a redes viárias alteradas e padrões de demanda inéditos, superando as limitações de desempenho em cenários de interrupções extremas.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Este artigo investiga a aplicação da aprendizagem simbólica para a deteção de falhas no processo de oxidação de etileno, demonstrando que este método supera abordagens baseadas em redes neurais em precisão e interpretabilidade, superando a escassez de dados reais através da simulação e propondo a integração desses modelos em agentes de apoio à decisão para operadores de plantas químicas.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

Gauge Freedom and Metric Dependence in Neural Representation Spaces

Este artigo demonstra que as representações de redes neurais possuem uma liberdade de gauge sob transformações lineares invertíveis, o que torna métricas comuns como a similaridade de cosseno dependentes da escolha de coordenadas e instáveis, sugerindo que a análise deve focar em quantidades invariantes ou em coordenadas canônicas.

Jericho Cain2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

O artigo propõe o HGT-Scheduler, um framework de aprendizado por reforço que utiliza Transformers de Grafos Heterogêneos para modelar o Problema de Programação de Oficinas (JSSP) preservando a semântica distinta das arestas de precedência e contenção, demonstrando superioridade estatística sobre abordagens homogêneas em instâncias de benchmark como o FT06.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

O artigo apresenta o SpatialMAGIC, um modelo híbrido inovador que integra difusão em grafos e atenção espacial para imputar dados de transcriptômica espacial, superando métodos existentes na redução de ruído e esparsidade enquanto preserva a arquitetura tecidual e melhora a interpretação biológica.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

O artigo apresenta o *xaitimesynth*, um pacote Python de código aberto que fornece infraestrutura reutilizável para avaliar métodos de atribuição em séries temporais, gerando dados sintéticos com verdade fundamental conhecida e métricas padronizadas de localização.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Este artigo propõe um modelo de difusão informado por física baseado na arquitetura Context-UNet para gerar dados sintéticos de eventos climáticos extremos e raros, superando a escassez de amostras e o desequilíbrio de classes que limitam o desenvolvimento de modelos de aprendizado de máquina robustos para a detecção de ciclones tropicais.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

O artigo apresenta a Regularização de Política Otimista (OPR), um mecanismo leve que preserva trajetórias historicamente bem-sucedidas para evitar a convergência prematura em aprendizado por reforço profundo, demonstrando ganhos significativos em eficiência de amostras e desempenho final em ambientes como Atari e CAGE Challenge 2.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

O artigo apresenta o Best-of-Tails (BoT), um novo framework de alinhamento em tempo de inferência que utiliza a estimativa da cauda da distribuição de recompensas para adaptar dinamicamente a estratégia de seleção entre otimismo e pessimismo, superando as limitações de métodos fixos ao equilibrar a exploração de respostas de alta qualidade com a mitigação de erros de recompensa.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

O NEST é um framework de placemento de dispositivos para aprendizado profundo distribuído que unifica o paralelismo de modelo, a modelagem de topologia de rede e a viabilidade de memória através de programação dinâmica estruturada, resultando em melhorias significativas de throughput e eficiência em comparação com métodos anteriores.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Multi-Agent Reinforcement Learning with Submodular Reward

Este artigo apresenta o primeiro quadro formal e algoritmos com garantias teóricas para aprendizado por reforço multiagente cooperativo com recompensas submodulares, superando a maldição da dimensionalidade e oferecendo limites de aproximação e regret para cenários de dinâmica conhecida e desconhecida.

Wenjing Chen, Chengyuan Qian, Shuo Xing, Yi Zhou, Victoria Crawford2026-03-10🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

O artigo apresenta o CREDO, um método que combina envelopes credais interpretáveis com conformalização para gerar intervalos de previsão em regressão que garantem cobertura marginal sem distribuição, ao mesmo tempo que explicitam a incerteza epistêmica e melhoram a adaptabilidade à esparsidade dos dados.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael Izbicki2026-03-10🤖 cs.LG

← Anterior Próximo →