cs.LG artigos | Gist.Science

Estimating condition number with Graph Neural Networks

Este artigo propõe um método rápido baseado em Redes Neurais em Grafos (GNNs) para estimar o número de condição de matrizes esparsas, que alcança uma aceleração significativa em comparação com os métodos Hager-Higham e Lanczos, graças a uma engenharia de recursos eficiente com complexidade $\mathrm{O}(\mathrm{nnz} + n)$ .

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

O artigo demonstra que o ajuste fino supervisionado (SFT) com ponderação exponencial de recompensas é um método robusto, totalmente offline e teoricamente fundamentado para alinhar sistemas de recomendação generativos às preferências dos usuários, superando as limitações e instabilidades dos métodos tradicionais de RLHF.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Este artigo propõe o framework ADMM-PnP com o denoiser AC-DC, que integra correção automática, correção direcional e remoção de ruído baseada em pontuação para resolver problemas inversos com garantias de convergência e melhor qualidade de solução.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

O artigo propõe o uso da Decomposição em Valores Singulares Generalizada (GSVD) para criar uma métrica de "ângulo" interpretável que quantifica a contribuição relativa de dois conjuntos de dados na explicação de uma amostra, permitindo diagnósticos geométricos por amostra e aplicações de classificação.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

O artigo apresenta o Copula-ResLogit, um novo framework de modelagem conjunta baseado em aprendizado profundo e cópulas que integra arquiteturas ResNet para detectar e mitigar efeitos de confusão não observada em análises de demanda de transporte, demonstrando sua eficácia na eliminação de dependências não causais em estudos de caso sobre tempo de espera de pedestres e escolha de modo de viagem.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

O artigo propõe o MultiwayPAM, um novo método de agrupamento tensorial que analisa os escores do paradigma "LLM como Juiz" para mitigar custos computacionais e vieses, permitindo identificar simultaneamente a estrutura de clusters e os representantes centrais (medoides) de perguntas, respondentes e avaliadores.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Este estudo demonstra que circuitos quânticos emaranhados oferecem uma vantagem competitiva em jogos adversariais, superando circuitos separáveis e redes neurais clássicas ao aprender representações estruturalmente distintas para modelar interações dinâmicas.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

O artigo apresenta o HyMEM, uma memória estruturada híbrida e autoevolutiva inspirada no cérebro humano que combina nós simbólicos discretos com embeddings contínuos em um grafo, permitindo que agentes de GUI de código aberto com backbones menores superem modelos proprietários de ponta ao melhorar a recuperação de informações e a gestão de tarefas de longo prazo.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

O artigo apresenta o GaLoRA, um framework eficiente em parâmetros que integra informações estruturais em grandes modelos de linguagem para classificação de nós em grafos atribuídos a texto, alcançando desempenho competitivo com apenas 0,24% dos parâmetros necessários para o ajuste fino completo.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Este trabalho apresenta um framework de aprendizado em contexto (in-context learning) orientado por regimes que utiliza modelos de linguagem grandes (LLMs) pré-treinados para prever a volatilidade financeira em condições de mercado não estacionárias, demonstrando superioridade sobre abordagens clássicas e aprendizado direto, especialmente em períodos de alta volatilidade.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Este artigo apresenta um procedimento de busca para identificar formas de cronogramas de taxa de aprendizado quase ótimos, revelando que o aquecimento e o decaimento são características robustas, mas que as famílias de cronogramas comumente utilizadas não são ideais e que o decaimento de peso influencia significativamente a forma ótima.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

Este artigo propõe e valida experimentalmente um método de amostragem flexível e eficaz, baseado em busca estocástica em feixe, para otimizar modelos de linguagem mascarados (MLMs) na engenharia de proteínas, demonstrando que a escolha do método de amostragem é tão impactante quanto a seleção do modelo em campanhas de desenvolvimento de anticorpos terapêuticos.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Este artigo apresenta um framework de aprendizado de operadores não locais baseado em kernels de integração orientados por dados, que separa a agregação não local da previsão não linear local para criar modelos climáticos interpretáveis e eficientes, demonstrando sua eficácia na previsão de precipitação da monção sul-asiática com significativamente menos parâmetros.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

O artigo apresenta o NasoVoce, uma interface montada na ponte do nariz que combina microfones e sensores de vibração para capturar sinais acústicos e de condução óssea, permitindo conversas de voz discretas e robustas a ruídos ambientais para interação com IA.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

O artigo apresenta o FairFAL, um framework de aprendizado ativo federado adaptativo que supera os desafios de desequilíbrio global de classes e heterogeneidade não-IID ao selecionar dinamicamente modelos de consulta e empregar estratégias de amostragem balanceadas para melhorar o desempenho em cenários realistas.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Este artigo investiga o problema de identificação do melhor braço em bandits lineares não estacionários, estabelecendo um limite inferior dependente do conjunto de braços e propondo o algoritmo $\textsf{Adjacent-BAI}$ , que atinge a complexidade ótima ao explorar a estrutura geométrica do conjunto de braços.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

O artigo apresenta o HEAL, um quadro de aprendizado sem reforço que supera as limitações da destilação tradicional ao integrar mecanismos de reparo assistido por entropia, estimativa de incerteza e evolução curricular progressiva para transferir capacidades de raciocínio de modelos grandes para modelos menores, permitindo que estes aprendam a resolver problemas complexos que os modelos professores não conseguem resolver sozinhos.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

O artigo propõe os Grafos de Conceitos Causais (CCG), uma estrutura que mapeia dependências causais entre conceitos em espaços latentes de modelos de linguagem para aprimorar o raciocínio passo a passo, demonstrando superioridade sobre métodos existentes em tarefas de raciocínio lógico.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Este artigo propõe uma nova lei de escalonamento para modelos Mixture-of-Experts (MoE) que define uma relação de potência para a alocação ótima de computação entre camadas de atenção e especialistas, permitindo o ajuste preciso de arquiteturas escaláveis dentro de orçamentos de computação fixos.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Este trabalho propõe uma estratégia de ponderação adaptativa baseada na variância para equilibrar a dinâmica de treinamento dos modelos de difusão em diferentes níveis de ruído, resultando em melhor desempenho generativo e maior estabilidade em conjuntos de dados como CIFAR-10 e CIFAR-100.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← Anterior Próximo →