cs.LG artigos | Gist.Science

Learning to Cover: Online Learning and Optimization with Irreversible Decisions

Este artigo propõe e analisa um algoritmo assintoticamente ótimo para um problema de aprendizado online e otimização com decisões irreversíveis de cobertura, demonstrando que uma política que equilibra exploração inicial e exploração subsequente minimiza o arrependimento de forma sublinear à medida que o número de instalações aumenta.

Alexandre Jacquillat, Michael Lingzhi Li2026-03-06🔢 math

Parallel Split Learning with Global Sampling

O artigo apresenta o GPSL, um esquema de aprendizado dividido paralelo que, ao fixar o tamanho do lote global e utilizar amostragem global, elimina vieses de arredondamento e estabiliza o treinamento em cenários de dados não-IID, alcançando precisão comparável à centralizada com overhead negligenciável.

Mohammad Kohankhaki, Ahmad Ayad, Mahdi Barhoush + 1 more2026-03-06💻 cs

Towards a Fairer Non-negative Matrix Factorization

Este artigo propõe uma abordagem de fatoração de matriz não negativa (NMF) com uma formulação min-max para mitigar viés em tarefas de aprendizado de máquina, apresentando algoritmos de otimização e evidenciando, por meio de experimentos, que o aumento da equidade pode ocorrer às custas de um maior erro para alguns indivíduos, ressaltando a necessidade de adaptar a escolha do método ao contexto específico da aplicação.

Lara Kassab, Erin George, Deanna Needell + 3 more2026-03-06💻 cs

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Este artigo apresenta um estudo experimental abrangente que demonstra que modelos de aprendizado de máquina conscientes de justiça alcançam um melhor equilíbrio entre precisão preditiva e equidade em comparação com modelos de classificação tradicionais no contexto de pontuação de crédito.

Huyen Giang Thi Thu, Thang Viet Doan, Ha-Bang Ban + 1 more2026-03-06💻 cs

Path Planning for Masked Diffusion Model Sampling

Este artigo apresenta o Path Planning (P2), uma nova estratégia de amostragem para Modelos de Difusão Mascaramento (MDMs) que generaliza métodos existentes ao introduzir um estágio de planejamento para selecionar e refinar tokens, resultando em melhorias significativas no desempenho generativo em diversas tarefas como biologia, raciocínio matemático e geração de código.

Fred Zhangzhi Peng, Zachary Bezemek, Sawan Patel + 5 more2026-03-06💻 cs

Curse of Dimensionality in Neural Network Optimization

Este artigo demonstra que a otimização de redes neurais rasas sofre da maldição da dimensionalidade, onde a taxa de decaimento do risco populacional durante o treinamento por fluxo de gradiente é limitada pela suavidade da função alvo e pela dimensão do espaço, resultando em convergência lenta que piora conforme a dimensionalidade aumenta.

Sanghoon Na, Haizhao Yang2026-03-06🔢 math

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

Este trabalho estende o método de fluxo de entropia para derivar limites de generalização para uma ampla classe de algoritmos de aprendizado governados por processos de Markov, estabelecendo uma conexão unificada entre o erro de generalização e as propriedades ergódicas desses processos por meio de novas fórmulas exatas e aproximações de tempo contínuo.

Benjamin Dupuis, Maxime Haddouche, George Deligiannidis + 1 more2026-03-06💻 cs

Sink equilibria and the attractors of learning in games

Este artigo refuta a conjectura de que existe uma correspondência biunívoca entre os atratores da dinâmica replicadora e as equações de sumidouro em jogos, demonstrando contraexemplos baseados em "fontes locais" e estabelecendo a pseudoconvexidade como uma condição suficiente para que tal correspondência seja válida em jogos de dois jogadores.

Oliver Biggar, Christos Papadimitriou2026-03-06💻 cs

FBFL: A Field-Based Coordination Approach for Data Heterogeneity in Federated Learning

Este artigo propõe o FBFL, uma abordagem de aprendizado federado baseada em campos que utiliza macroprogramação e coordenação espacial para criar uma arquitetura hierárquica auto-organizada, superando os desafios de heterogeneidade de dados não-IID e falhas de servidor, enquanto supera métodos existentes como FedAvg, FedProx e Scaffold em cenários não-IID.

Davide Domini, Gianluca Aguzzi, Lukas Esterle + 1 more2026-03-06💻 cs

Double Momentum and Error Feedback for Clipping with Fast Rates and Differential Privacy

O artigo propõe e analisa o algoritmo Clip21-SGD2M, que combina clipping, momentum de heavy-ball e feedback de erro para alcançar simultaneamente garantias ótimas de convergência e privacidade diferencial em cenários de aprendizado federado com dados heterogêneos.

Rustem Islamov, Samuel Horvath, Aurelien Lucchi + 2 more2026-03-06🔢 math

Generative Models in Decision Making: A Survey

Esta pesquisa apresenta uma revisão abrangente que propõe uma taxonomia unificada baseada no raciocínio probabilístico para classificar modelos generativos em quatro funções distintas (controladores, modeladores, otimizadores e avaliadores) no contexto da tomada de decisão, analisando seus desafios de aplicação em domínios de alto risco e traçando o caminho para a Inteligência Física Generalista.

Xinyu Shao, Jianping Zhang, Haozhi Wang + 9 more2026-03-06💻 cs

BACE-RUL: A Bi-directional Adversarial Network with Covariate Encoding for Machine Remaining Useful Life Prediction

Este artigo propõe o modelo BACE-RUL, uma rede adversária bi-direcional com codificação de covariáveis que prevê a vida útil remanescente de máquinas utilizando apenas medições de sensores do ciclo atual, superando métodos existentes em precisão e aplicabilidade em cenários do mundo real.

Zekai Zhang, Dan Li, Shunyu Wu + 4 more2026-03-06💻 cs

Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

O artigo identifica o "miragem de segurança" como uma falha no ajuste fino supervisionado de Modelos de Linguagem e Visão (VLMs) que reforça correlações espúrias, e propõe o desaprendizado de máquina como uma solução eficaz para reduzir ataques de segurança e rejeições desnecessárias de consultas benignas.

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Este artigo apresenta uma investigação empírica em larga escala que revela que a capacidade de modelos de linguagem grandes (LLMs) de localizar falhas em código é altamente frágil a mutações semânticas, indicando que seu raciocínio depende excessivamente de pistas sintáticas irrelevantes em vez de compreender a lógica profunda do programa.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

ms-Mamba: Multi-scale Mamba for Time-Series Forecasting

Este artigo apresenta o ms-Mamba, uma nova arquitetura de previsão de séries temporais que supera os métodos atuais ao processar dados em múltiplas escalas temporais utilizando blocos Mamba com taxas de amostragem variadas, alcançando maior precisão com menor custo computacional.

Yusuf Meric Karadag, Ismail Talaz, Ipek Gursel Dino + 1 more2026-03-06💻 cs

TianQuan-S2S: A Subseasonal-to-Seasonal Global Weather Model via Incorporate Climatology State

O artigo apresenta o TianQuan-S2S, um modelo global de previsão meteorológica subestacional a sazonal que integra estados climáticos e um Transformer aumentado por incerteza para superar as limitações de métodos tradicionais e baseados em dados, demonstrando desempenho superior em variáveis meteorológicas-chave.

Guowen Li, Xintong Liu, Yang Liu + 11 more2026-03-06💻 cs

Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging

O artigo apresenta o "Noise2Ghost", um novo método de reconstrução de imagem fantasma baseado em aprendizado profundo auto-supervisionado que elimina a necessidade de dados de referência limpos e oferece redução de ruído superior, permitindo aplicações de alta qualidade em cenários de baixa luminosidade, como imageamento de raios-X de amostras biológicas e baterias.

Mathieu Manni, Dmitry Karpov, K. Joost Batenburg + 2 more2026-03-06🔬 physics

Differentially Private and Scalable Estimation of the Network Principal Component

Este artigo propõe um mecanismo escalável e baseado no framework Propose-Test-Release (PTR) para a estimação privada do componente principal de grafos sob privacidade diferencial de arestas, alcançando uma precisão superior em grafos "bem-comportados" e uma melhoria de 180 vezes no tempo de execução em comparação com métodos existentes, além de permitir a primeira solução com privacidade diferencial para o problema do subgrafo mais denso.

Alireza Khayatian, Anil Vullikanti, Aritra Konar2026-03-06💻 cs

Variational Formulation of Particle Flow

Este artigo apresenta uma formulação variacional do fluxo de partículas log-homotópico, demonstrando que ele segue um gradiente de Fisher-Rao no espaço de densidades e derivando versões aproximadas por distribuições Gaussianas e misturas Gaussianas que, sob certas condições, se reduzem ao fluxo de partículas exato de Daum e Huang.

Yinzhuang Yi, Jorge Cortés, Nikolay Atanasov2026-03-06💻 cs

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

O artigo apresenta o ReactDance, um framework de difusão que utiliza uma representação latente hierárquica com quantização escalar finita (HFSQ) e uma estratégia de amostragem não autoregressiva baseada em blocos (BLC) para gerar danças reativas de alta fidelidade e coerência temporal em sequências longas.

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

← Anterior Próximo →