Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este artigo estabelece um quadro matemático unificado chamado "Gradient Flow Drifting" que demonstra a equivalência entre o modelo Drifting e o fluxo de gradiente de Wasserstein da divergência KL forward sob aproximação de estimativa de densidade por kernel, permitindo a criação de uma nova família de modelos generativos que combinam diferentes divergências para evitar colapso e borramento de modos, inclusive em variedades Riemannianas.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Este artigo apresenta o Geo-ATBench, um novo benchmark e tarefa de rotulagem de áudio geoespacial que integra contexto semântico geográfico para melhorar a identificação de eventos sonoros, juntamente com o framework GeoFusion-AT que demonstra que a fusão desses dados com áudio supera abordagens baseadas apenas no som.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

O artigo propõe a Recompensa de Expectativa Condicional (CER), um método que utiliza o próprio modelo de linguagem como verificador implícito para fornecer sinais de recompensa graduais e eliminar a dependência de regras de verificação externas, ampliando assim a eficácia do Aprendizado por Reforço com Recompensas Verificáveis (RLVR) para domínios de raciocínio de resposta livre.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Este trabalho propõe o uso de Redes Decodificadoras Recorrentes Superficiais (SHRED) combinadas com decomposição em valores singulares (SVD) como um modelo substituto eficiente e baseado em dados para reconstruir em tempo real os campos completos de velocidade, pressão e temperatura em sistemas de fusão nuclear, utilizando apenas medições térmicas esparsas e demonstrando robustez frente a variações paramétricas e posicionamento de sensores.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

O artigo apresenta o EvoSchema, um benchmark abrangente que introduz uma nova taxonomia de evolução de esquemas para avaliar e melhorar a robustez dos modelos de texto-para-SQL frente a mudanças dinâmicas em bancos de dados, demonstrando que perturbações no nível de tabelas impactam mais o desempenho e que o treinamento com dados diversificados gera sistemas mais resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Este artigo apresenta o algoritmo "Sample-and-Search", uma abordagem de aprendizado aumentado para o problema de agrupamento kk-médias em altas dimensões que utiliza amostragem e pré-processamento com preditores para reduzir significativamente a complexidade computacional e o custo de agrupamento em comparação com métodos existentes.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artigo compara a estimativa de incerteza via Monte Carlo Dropout e a Predição Conformal em redes neurais convolucionais treinadas no Fashion-MNIST, demonstrando que, embora o H-CNN VGG16 tenha maior precisão, o GoogLeNet oferece melhor calibração e a Predição Conformal garante conjuntos de previsão estatisticamente válidos, reforçando a necessidade de avaliar modelos além da simples acurácia para aplicações de alto risco.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

O artigo propõe uma arquitetura de autoencoder baseada em aprendizado profundo para o quadro de computação distribuída aleatorizada (RDFC), visando minimizar a distância da variação total em relação a uma distribuição alvo desconhecida e demonstrando ganhos significativos em carga de comunicação em comparação com métodos de compressão de dados.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

O artigo apresenta uma abordagem baseada em Funções de Hardware Inimitáveis (PUFs) para vincular os pesos de modelos de Redes Neurais às propriedades únicas do hardware subjacente, impedindo assim a execução precisa desses modelos em hardware clonado e protegendo a Propriedade Intelectual incorporada.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG