cs.LG artigos | Gist.Science

EvoESAP: Non-Uniform Expert Pruning for Sparse MoE

O artigo apresenta o EvoESAP, um método de poda de especialistas não uniforme para modelos MoE esparsos que utiliza uma métrica baseada em aceitação especulativa (ESAP) e busca evolutiva para otimizar a alocação de orçamento entre camadas, resultando em ganhos significativos de desempenho na geração de texto aberto sem comprometer a precisão em tarefas de múltipla escolha.

Zongfang Liu, Shengkun Tang, Boyang Sun, Zhiqiang Shen, Xin Yuan2026-03-09🤖 cs.LG

Preventing Learning Stagnation in PPO by Scaling to 1 Million Parallel Environments

O artigo demonstra que o estagnamento de aprendizado no PPO ocorre quando as estimativas baseadas em amostras se tornam proxies ruins do objetivo real, propondo que escalar para mais de 1 milhão de ambientes paralelos, ajustando adequadamente os hiperparâmetros, permite reduzir o ruído e o tamanho do passo para alcançar melhorias monotônicas de desempenho até um trilhão de transições.

Michael Beukman, Khimya Khetarpal, Zeyu Zheng, Will Dabney, Jakob Foerster, Michael Dennis, Clare Lyle2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

Este artigo melhora os limites conhecidos para a complexidade de aprendizado agnóstico sob marginais gaussianas, demonstrando que um grau polinomial de $\tilde O(\Gamma^2 / \varepsilon^2)$ é suficiente para aproximar classes de conceitos com área de superfície gaussiana $\Gamma$ , resultando em limites quase ótimos para funções de limiar polinomial no modelo de consultas estatísticas.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Improved high-dimensional estimation with Langevin dynamics and stochastic weight averaging

Este artigo demonstra que a dinâmica de Langevin, combinada com a média dos iterados, consegue recuperar uma direção oculta em cenários de alta dimensão com uma complexidade de amostragem ótima de $n \gtrsim d^{k^\star/2}$ , superando limites anteriores sem a necessidade de suavização explícita do terreno.

Stanley Wei, Alex Damian, Jason D. Lee2026-03-09🤖 cs.LG

TempoSyncDiff: Distilled Temporally-Consistent Diffusion for Low-Latency Audio-Driven Talking Head Generation

O artigo apresenta o TempoSyncDiff, um framework de difusão latente baseado em distilação que utiliza um modelo professor-aluno e regularização temporal para gerar cabeças falantes acionadas por áudio com alta fidelidade, estabilidade temporal e baixa latência, viabilizando sua implementação em dispositivos de borda.

Soumya Mazumdar, Vineet Kumar Rakesh2026-03-09🤖 cs.AI

Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra

O artigo apresenta o IR-GeoDiff, um modelo de difusão latente inovador que recupera geometrias moleculares tridimensionais a partir de espectros de infravermelho ao integrar informações espectrais nas representações de nós e arestas, superando as limitações das abordagens anteriores baseadas em estruturas bidimensionais.

Wenjin Wu, Aleš Leonardis, Linjiang Chen, Jianbo Jiao2026-03-09🤖 cs.LG

Dynamic Momentum Recalibration in Online Gradient Learning

O artigo propõe o otimizador SGDF, que utiliza princípios de filtragem linear ótima para recalibrar dinamicamente os coeficientes de momento no aprendizado por gradiente, superando métodos convencionais ao equilibrar idealmente a supressão de ruído e a preservação do sinal.

Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li2026-03-09🤖 cs.LG

Diffusion Language Models Are Natively Length-Aware

Este artigo propõe um mecanismo zero-shot que utiliza a representação latente do prompt para estimar e ajustar dinamicamente o tamanho do contexto em Modelos de Linguagem de Difusão antes da geração, resultando em ganhos significativos de eficiência computacional sem comprometer o desempenho em diversas tarefas.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection

Este artigo propõe a DQE, uma nova métrica de avaliação para detecção de anomalias em séries temporais que supera as limitações das abordagens existentes ao incorporar uma segmentação semântica das anomalias e uma agregação de qualidade sobre todo o espectro de limiares, resultando em uma avaliação mais estável, discriminativa e interpretável.

Yuewei Li, Dalin Zhang, Huan Li, Xinyi Gong, Hongjun Chu, Zhaohui Song2026-03-09🤖 cs.LG

Partial Policy Gradients for RL in LLMs

O artigo propõe uma abordagem de Gradientes de Política Parciais para Aprendizado por Reforço em LLMs, que otimiza subconjuntos de recompensas futuras para modelar diferentes classes de políticas (como planejamento completo, gananciosa ou com horizonte limitado), demonstrando empiricamente que diferentes políticas se destacam em diferentes problemas de alinhamento conversacional.

Puneet Mathur, Branislav Kveton, Subhojyoti Mukherjee, Viet Dac Lai2026-03-09🤖 cs.AI

Predictive Coding Graphs are a Superset of Feedforward Neural Networks

O artigo demonstra que os Grafos de Codificação Preditiva (PCGs) constituem um conjunto matematicamente superior às redes neurais feedforward, posicionando-os como uma generalização mais ampla dentro do aprendizado de máquina contemporâneo.

Björn van Zwol2026-03-09🤖 cs.AI

Ensemble Graph Neural Networks for Probabilistic Sea Surface Temperature Forecasting via Input Perturbations

Este artigo demonstra que a aplicação de perturbações de entrada estruturadas, como ruído de Perlin, em redes neurais gráficas (GNNs) permite gerar previsões probabilísticas de temperatura da superfície do mar bem calibradas e eficientes para a região das Ilhas Canárias, sem a necessidade de custos adicionais de treinamento.

Alejandro J. González-Santana, Giovanny A. Cuervo-Londoño, Javier Sánchez2026-03-09🤖 cs.AI

Efficient Vector Search in the Wild: One Model for Multi-K Queries

O artigo apresenta o OMEGA, um método de busca aprendida que, ao treinar um modelo base apenas para K=1 e aplicar refinamentos dinâmicos, permite atender consultas de múltiplos valores de K com alta precisão e desempenho, reduzindo significativamente o tempo de latência e os custos de pré-processamento em comparação com métodos existentes.

Yifan Peng, Jiafei Fan, Xingda Wei, Sijie Shen, Rong Chen, Jianning Wang, Xiaojian Luo, Wenyuan Yu, Jingren Zhou, Haibo Chen2026-03-09🤖 cs.LG

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

Este artigo propõe uma estrutura de duas etapas que combina aprendizado contrastivo supervisionado em alfabetos inventados com destilação de conhecimento para aprendizado auto-supervisionado em scripts históricos, permitindo a extração de representações de glifos que capturam tanto distinções claras quanto similaridades evolutivas latentes sem depender de relações de ground-truth.

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

Random Quadratic Form on a Sphere: Synchronization by Common Noise

Este artigo introduz a Forma Quadrática Aleatória (RQF), um modelo estocástico que demonstra como o ruído comum pode sincronizar dinâmicas em esferas, oferecendo uma explicação independente da atenção automática para o comportamento de agrupamento (clustering) observado em transformadores profundos.

Maximilian Engel, Anna Shalova2026-03-09🤖 cs.LG

Topological descriptors of foot clearance gait dynamics improve differential diagnosis of Parkinsonism

Este estudo demonstra que a integração da Análise Topológica de Dados com aprendizado de máquina, utilizando descritores de homologia persistente sobre séries temporais de elevação do pé, melhora significativamente a precisão no diagnóstico diferencial entre Doença de Parkinson Idiopática e Parkinsonismo Vascular.

Jhonathan Barrios, Wolfram Erlhagen, Miguel F. Gago, Estela Bicho, Flora Ferreira2026-03-09🤖 cs.LG

FedSCS-XGB -- Federated Server-centric surrogate XGBoost for continual health monitoring

Este artigo apresenta o FedSCS-XGB, um protocolo de aprendizado de máquina distribuído baseado em XGBoost que permite o monitoramento contínuo de saúde em dispositivos vestíveis com desempenho equivalente ao treinamento centralizado, preservando a privacidade dos dados e as propriedades estruturais do modelo.

Felix Walger, Mehdi Ejtehadi, Anke Schmeink, Diego Paez-Granados2026-03-09🤖 cs.LG

DC-Merge: Improving Model Merging with Directional Consistency

O artigo propõe o DC-Merge, um método de fusão de modelos que melhora a retenção de conhecimento ao equilibrar a distribuição de energia dos vetores de tarefa e alinhar suas geometrias direcionais em um subespaço ortogonal compartilhado, alcançando desempenho superior em benchmarks de visão e visão-linguagem.

Han-Chen Zhang, Zi-Hao Zhou, Mao-Lin Luo, Shimin Di, Min-Ling Zhang, Tong Wei2026-03-09🤖 cs.LG

Gradient Flow Polarizes Softmax Outputs towards Low-Entropy Solutions

O artigo demonstra que o fluxo de gradiente em modelos de softmax com valores inerentemente direciona a otimização para soluções de baixa entropia, oferecendo uma explicação teórica para fenômenos empíricos como "attention sinks" e ativações massivas em transformers.

Aditya Varre, Mark Rofin, Nicolas Flammarion2026-03-09🤖 cs.LG

SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data

O artigo propõe o método SPPCSO, uma técnica de estimação penalizada adaptativa que integra regressão por componentes principais e regularização $L_1$ para superar a instabilidade em dados de alta dimensão e correlacionados, garantindo seleção de variáveis consistente e estimativas robustas mesmo em ambientes de alto ruído.

Ying Hu, Hu Yang2026-03-09🤖 cs.LG

← Anterior Próximo →