Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Este artigo propõe um algoritmo distribuído e adaptativo de identificação do melhor braço em bandits lineares para otimizar a colocação de serviços em redes de pequenas células, permitindo que estações base colaborativas identifiquem com alta confiança e eficiência a melhor opção de processamento na borda para minimizar a latência do usuário.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Este artigo estabelece taxas de convergência para a última iteração de métodos de descida de gradiente estocástico (SGD) e de bola pesada estocástica (SHB) em cenários convexos e não convexos com gradientes Hölder-contínuos, utilizando apenas a desigualdade discreta de Gronwall para obter resultados que recuperam e estendem taxas conhecidas para funções objetivo com diferentes graus de suavidade.

Marcel Hudiani2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Este trabalho apresenta o LangevinFlow, um modelo de codificador-variacional sequencial que utiliza equações de Langevin subamortecidas e um potencial baseado em osciladores acoplados para capturar com alta precisão a dinâmica latente de populações neurais, superando métodos existentes na previsão de taxas de disparo e na decodificação de comportamentos.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

O artigo apresenta a Latent Policy Steering (LPS), uma abordagem que aprimora políticas visuomotoras em cenários com poucos dados ao pré-treinar um Modelo de Mundo usando fluxo óptico como representação de ação agnóstica ao corpo, permitindo aproveitar dados de múltiplas efetuações e, subsequentemente, selecionar as melhores ações para o robô-alvo, resultando em melhorias significativas de desempenho tanto em simulação quanto no mundo real.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

O artigo apresenta o CTRL (Clustered Transfer Residual Learning), um método de meta-aprendizado que combina aprendizado residual entre domínios e agrupamento adaptativo para melhorar a precisão geral e preservar a heterogeneidade entre fontes em tarefas de aprendizado de máquina com muitos conjuntos de dados pequenos e desiguais, demonstrando superioridade sobre benchmarks em cinco conjuntos de dados, incluindo um programa nacional de asilo na Suíça.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

O artigo apresenta o MuFlex, uma plataforma de código aberto e escalável baseada em física que permite a coordenação de flexibilidade de demanda em múltiplos edifícios detalhados (EnergyPlus e Modelica) através de aprendizado por reforço, demonstrando sua eficácia na redução de picos de carga e validando sua escalabilidade em diversos cenários de simulação.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Este artigo apresenta uma metodologia de aprendizado em contexto iterativo que seleciona exemplos de forma incremental para melhorar a generalização sistemática de LLMs em tarefas de raciocínio abstrato, como álgebra com regras não padrão, demonstrando que exemplos mais simples podem ser mais eficazes do que aqueles que seguem a distribuição dos dados de teste.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Este trabalho desenvolve um modelo substituto baseado em uma rede neural residual totalmente conectada (FCRN) treinada com simulações de elementos finitos para prever rapidamente a distribuição de densidade de corrente e otimizar o projeto de ímãs solenoides REBCO de grande escala, superando os métodos tradicionais em velocidade e mantendo alta precisão.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Este artigo investiga métodos de Monte Carlo com pontos repulsivos para calcular a distância de Wasserstein fatiada, analisando e comparando diversas quadraturas (incluindo processos determinantes e o estimador UnifOrtho) para concluir que o uso de Monte Carlo Quase-ortogonal é preferível em altas dimensões, enquanto métodos de Monte Carlo Quase-ortogonal aleatorizado são mais eficazes em baixas dimensões.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Este trabalho apresenta o Robot Control Stack (RCS), um ecossistema leve e modular projetado para superar os gargalos dos frameworks tradicionais de robótica, permitindo a pesquisa e o treinamento em larga escala de políticas generalistas baseadas em modelos Visão-Linguagem-Ação (VLAs) com transferência eficiente entre simulação e realidade.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

Este artigo propõe um modelo generativo baseado em pontuação que utiliza dinâmicas estocásticas de Kuramoto em domínios periódicos para capturar padrões direcionais coerentes em imagens ricas em orientação, como impressões digitais e texturas, superando as limitações dos métodos de difusão euclidiana isotrópica ao modelar a sincronização e dessincronização de fases.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

O artigo propõe o VLCE, um framework que aprimora a descrição de imagens de desastres ao integrar conhecimento semântico externo (ConceptNet e WordNet) a modelos visão-linguagem, resultando em legendas mais precisas, factualmente consistentes e ricas em vocabulário específico do domínio em comparação com modelos de propósito geral.

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Este artigo apresenta a Composição Geral de Políticas (GPC), um método livre de treinamento que melhora o desempenho de políticas robóticas baseadas em difusão ou fluxo, combinando suas distribuições de scores em tempo de teste para superar o desempenho de políticas individuais sem a necessidade de novos dados de interação.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Este artigo propõe um controlador híbrido que combina Aprendizado por Reforço Profundo (DRL) com Busca de Extremo Limitada (ES) para melhorar a robustez de sistemas não lineares variantes no tempo, superando as limitações individuais de cada método ao utilizar o DRL para controle rápido baseado em dados históricos e a ES para garantir estabilidade frente a variações dinâmicas.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG