cs.LG artigos | Gist.Science

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

Este artigo propõe um algoritmo distribuído e adaptativo de identificação do melhor braço em bandits lineares para otimizar a colocação de serviços em redes de pequenas células, permitindo que estações base colaborativas identifiquem com alta confiança e eficiência a melhor opção de processamento na borda para minimizar a latência do usuário.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

Este artigo estabelece taxas de convergência para a última iteração de métodos de descida de gradiente estocástico (SGD) e de bola pesada estocástica (SHB) em cenários convexos e não convexos com gradientes Hölder-contínuos, utilizando apenas a desigualdade discreta de Gronwall para obter resultados que recuperam e estendem taxas conhecidas para funções objetivo com diferentes graus de suavidade.

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

Este estudo avalia arquiteturas de DeepONet para o problema de consolidação em engenharia geotécnica, demonstrando que uma variante aprimorada com recursos de Fourier no tronco supera os modelos padrão e oferece acelerações computacionais significativas (até 1.000x em cenários 3D), viabilizando a quantificação eficiente de incertezas.

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

Este trabalho apresenta o LangevinFlow, um modelo de codificador-variacional sequencial que utiliza equações de Langevin subamortecidas e um potencial baseado em osciladores acoplados para capturar com alta precisão a dinâmica latente de populações neurais, superando métodos existentes na previsão de taxas de disparo e na decodificação de comportamentos.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

O artigo apresenta a Latent Policy Steering (LPS), uma abordagem que aprimora políticas visuomotoras em cenários com poucos dados ao pré-treinar um Modelo de Mundo usando fluxo óptico como representação de ação agnóstica ao corpo, permitindo aproveitar dados de múltiplas efetuações e, subsequentemente, selecionar as melhores ações para o robô-alvo, resultando em melhorias significativas de desempenho tanto em simulação quanto no mundo real.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

Este artigo apresenta o MLES, uma abordagem inovadora que combina modelos de linguagem grandes multimodais com busca evolutiva e análise visual de falhas para descobrir políticas de controle programáticas transparentes e verificáveis, alcançando desempenho comparável ao PPO em tarefas de controle padrão.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

O artigo apresenta o CTRL (Clustered Transfer Residual Learning), um método de meta-aprendizado que combina aprendizado residual entre domínios e agrupamento adaptativo para melhorar a precisão geral e preservar a heterogeneidade entre fontes em tarefas de aprendizado de máquina com muitos conjuntos de dados pequenos e desiguais, demonstrando superioridade sobre benchmarks em cinco conjuntos de dados, incluindo um programa nacional de asilo na Suíça.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Este artigo propõe e avalia uma abordagem inovadora que utiliza avatares virtuais e música gerada por IA para transformar sílabos textuais em apresentações audiovisuais cantadas, demonstrando que essa estratégia aumenta significativamente o engajamento, a compreensão e a retenção das informações essenciais pelos estudantes.

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

O artigo apresenta o MuFlex, uma plataforma de código aberto e escalável baseada em física que permite a coordenação de flexibilidade de demanda em múltiplos edifícios detalhados (EnergyPlus e Modelica) através de aprendizado por reforço, demonstrando sua eficácia na redução de picos de carga e validando sua escalabilidade em diversos cenários de simulação.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

Este trabalho apresenta um framework leve e eficiente em dados baseado em Redes Neurais em Grafos (GNN) e informado por domínio de RF para prever com alta precisão o desempenho de circuitos ativos, superando significativamente os métodos existentes em generalização e erro médio.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

Este artigo apresenta uma metodologia de aprendizado em contexto iterativo que seleciona exemplos de forma incremental para melhorar a generalização sistemática de LLMs em tarefas de raciocínio abstrato, como álgebra com regras não padrão, demonstrando que exemplos mais simples podem ser mais eficazes do que aqueles que seguem a distribuição dos dados de teste.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

Este trabalho desenvolve um modelo substituto baseado em uma rede neural residual totalmente conectada (FCRN) treinada com simulações de elementos finitos para prever rapidamente a distribuição de densidade de corrente e otimizar o projeto de ímãs solenoides REBCO de grande escala, superando os métodos tradicionais em velocidade e mantendo alta precisão.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

Este artigo investiga métodos de Monte Carlo com pontos repulsivos para calcular a distância de Wasserstein fatiada, analisando e comparando diversas quadraturas (incluindo processos determinantes e o estimador UnifOrtho) para concluir que o uso de Monte Carlo Quase-ortogonal é preferível em altas dimensões, enquanto métodos de Monte Carlo Quase-ortogonal aleatorizado são mais eficazes em baixas dimensões.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Este trabalho apresenta o Robot Control Stack (RCS), um ecossistema leve e modular projetado para superar os gargalos dos frameworks tradicionais de robótica, permitindo a pesquisa e o treinamento em larga escala de políticas generalistas baseadas em modelos Visão-Linguagem-Ação (VLAs) com transferência eficiente entre simulação e realidade.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

Este artigo propõe um modelo generativo baseado em pontuação que utiliza dinâmicas estocásticas de Kuramoto em domínios periódicos para capturar padrões direcionais coerentes em imagens ricas em orientação, como impressões digitais e texturas, superando as limitações dos métodos de difusão euclidiana isotrópica ao modelar a sincronização e dessincronização de fases.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

Este artigo demonstra que agentes de IA, como o AlphaEvolve, podem aprimorar resultados na teoria da complexidade ao gerar novas reduções de gadgets e verificar construções para estabelecer limites de aproximação mais rigorosos em problemas como MAX-CUT, MAX-4-CUT, MAX-3-CUT e o Problema do Caixeiro Viajante.

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

O artigo propõe o VLCE, um framework que aprimora a descrição de imagens de desastres ao integrar conhecimento semântico externo (ConceptNet e WordNet) a modelos visão-linguagem, resultando em legendas mais precisas, factualmente consistentes e ricas em vocabulário específico do domínio em comparação com modelos de propósito geral.

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

O artigo apresenta o ZeroSiam, uma arquitetura assimétrica Siamese eficiente que previne o colapso em modelos durante a minimização de entropia no tempo de teste, garantindo adaptação estável e melhor desempenho em tarefas de visão computacional e raciocínio de modelos de linguagem.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

Este artigo apresenta a Composição Geral de Políticas (GPC), um método livre de treinamento que melhora o desempenho de políticas robóticas baseadas em difusão ou fluxo, combinando suas distribuições de scores em tempo de teste para superar o desempenho de políticas individuais sem a necessidade de novos dados de interação.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

Este artigo propõe um controlador híbrido que combina Aprendizado por Reforço Profundo (DRL) com Busca de Extremo Limitada (ES) para melhorar a robustez de sistemas não lineares variantes no tempo, superando as limitações individuais de cada método ao utilizar o DRL para controle rápido baseado em dados históricos e a ES para garantir estabilidade frente a variações dinâmicas.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

← Anterior Próximo →