cs.LG artigos | Gist.Science

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este artigo estabelece um quadro matemático unificado chamado "Gradient Flow Drifting" que demonstra a equivalência entre o modelo Drifting e o fluxo de gradiente de Wasserstein da divergência KL forward sob aproximação de estimativa de densidade por kernel, permitindo a criação de uma nova família de modelos generativos que combinam diferentes divergências para evitar colapso e borramento de modos, inclusive em variedades Riemannianas.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Este artigo técnico descreve uma implementação compatível com JAX da família Broyden autoescalada de métodos quase-Newton, incluindo variantes como BFGS e DFP com busca por zoom, desenvolvida sobre a biblioteca Optimistix para facilitar sua adoção pela comunidade.

Ivan Bioli, Mikel Mendibe Abarrategi2026-03-12🤖 cs.LG

Geo-ATBench: A Benchmark for Geospatial Audio Tagging with Geospatial Semantic Context

Este artigo apresenta o Geo-ATBench, um novo benchmark e tarefa de rotulagem de áudio geoespacial que integra contexto semântico geográfico para melhorar a identificação de eventos sonoros, juntamente com o framework GeoFusion-AT que demonstra que a fusão desses dados com áudio supera abordagens baseadas apenas no som.

Yuanbo Hou, Yanru Wu, Qiaoqiao Ren, Shengchen Li, Stephen Roberts, Dick Botteldooren2026-03-12⚡ eess

Reinforcement Learning with Conditional Expectation Reward

O artigo propõe a Recompensa de Expectativa Condicional (CER), um método que utiliza o próprio modelo de linguagem como verificador implícito para fornecer sinais de recompensa graduais e eliminar a dependência de regras de verificação externas, ampliando assim a eficácia do Aprendizado por Reforço com Recompensas Verificáveis (RLVR) para domínios de raciocínio de resposta livre.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Este artigo apresenta uma abordagem inovadora e explicável para detectar e eliminar gatilhos de backdoor em redes neurais, utilizando caminhos ativos e validando sua eficácia em um modelo de detecção de intrusão.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

O artigo propõe o FAME, um novo método de explicações abdutivas baseado em interpretação abstrata que escala para grandes redes neurais, reduzindo o tamanho das explicações e eliminando a dependência da ordem de travessia através de domínios de perturbação dedicados e limites baseados em LiRPA.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Spatio-Temporal Attention Graph Neural Network: Explaining Causalities With Attention

Este artigo propõe uma Rede Neural de Grafos com Atenção Espacio-Temporal (STA-GNN) para detecção de anomalias explicável e adaptável a mudanças em Sistemas de Controle Industrial, integrando dados ciber-físicos e estratégias de previsão conformal para mitigar falsos positivos e melhorar a confiabilidade operacional.

Kosti Koistinen, Kirsi Hellsten, Joni Herttuainen, Kimmo K. Kaski2026-03-12🤖 cs.LG

Surrogate models for nuclear fusion with parametric Shallow Recurrent Decoder Networks: applications to magnetohydrodynamics

Este trabalho propõe o uso de Redes Decodificadoras Recorrentes Superficiais (SHRED) combinadas com decomposição em valores singulares (SVD) como um modelo substituto eficiente e baseado em dados para reconstruir em tempo real os campos completos de velocidade, pressão e temperatura em sistemas de fusão nuclear, utilizando apenas medições térmicas esparsas e demonstrando robustez frente a variações paramétricas e posicionamento de sensores.

M. Lo Verso, C. Introini, E. Cervi, L. Savoldi, J. N. Kutz, A. Cammi2026-03-12🤖 cs.LG

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

O artigo apresenta o método "Contract And Conquer" (CAC), que utiliza conhecimento destilado e contração do espaço de busca para garantir a geração provável de exemplos adversariais para modelos de caixa preta, superando os métodos atuais de ponta no conjunto de dados ImageNet.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

O artigo apresenta o EvoSchema, um benchmark abrangente que introduz uma nova taxonomia de evolução de esquemas para avaliar e melhorar a robustez dos modelos de texto-para-SQL frente a mudanças dinâmicas em bancos de dados, demonstrando que perturbações no nível de tabelas impactam mais o desempenho e que o treinamento com dados diversificados gera sistemas mais resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Riemannian MeanFlow for One-Step Generation on Manifolds

O artigo propõe o Riemannian MeanFlow (RMF), um método que estende o MeanFlow para variedades Riemannianas, permitindo a geração em uma única etapa com alta qualidade e baixo custo computacional ao evitar a integração numérica de ODEs por meio de um campo de velocidade média intrínseco e transporte paralelo.

Zichen Zhong, Haoliang Sun, Yukun Zhao, Yongshun Gong, Yilong Yin2026-03-12🤖 cs.LG

Sample-and-Search: An Effective Algorithm for Learning-Augmented k-Median Clustering in High dimensions

Este artigo apresenta o algoritmo "Sample-and-Search", uma abordagem de aprendizado aumentado para o problema de agrupamento $k$ -médias em altas dimensões que utiliza amostragem e pré-processamento com preditores para reduzir significativamente a complexidade computacional e o custo de agrupamento em comparação com métodos existentes.

Kangke Cheng, Shihong Song, Guanlin Mo, Hu Ding2026-03-12🤖 cs.LG

CacheSolidarity: Preventing Prefix Caching Side Channels in Multi-tenant LLM Serving Systems

O artigo apresenta o CacheSolidarity, um sistema que protege ambientes de inferência de LLMs multi-tenant contra canais laterais de temporização decorrentes do cache de prefixos, permitindo a reutilização segura de cache e melhor desempenho sem sacrificar a eficiência.

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri, Thaleia Dimitra Doudali2026-03-12🤖 cs.LG

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Este artigo compara a estimativa de incerteza via Monte Carlo Dropout e a Predição Conformal em redes neurais convolucionais treinadas no Fashion-MNIST, demonstrando que, embora o H-CNN VGG16 tenha maior precisão, o GoogLeNet oferece melhor calibração e a Predição Conformal garante conjuntos de previsão estatisticamente válidos, reforçando a necessidade de avaliar modelos além da simples acurácia para aplicações de alto risco.

Sanne Ruijs, Alina Kosiakova, Farrukh Javed2026-03-12📊 stat

A Grammar of Machine Learning Workflows

Este artigo propõe uma solução estrutural para o vazamento de dados em workflows de aprendizado de máquina, introduzindo uma gramática baseada em grafos acíclicos direcionados com restrições de tempo de execução que previnem falhas críticas de avaliação, superando as abordagens tradicionais baseadas apenas em documentação.

Simon Roth2026-03-12🤖 cs.LG

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

O artigo apresenta o CUPID, um módulo plug-in versátil que estima conjuntamente a incerteza aleatória e epistêmica em redes neurais pré-treinadas sem necessidade de retreinamento, permitindo uma análise interpretável e model-agnóstica da origem das incertezas em diversas tarefas de aprendizado profundo.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

Deep Randomized Distributed Function Computation (DeepRDFC): Neural Distributed Channel Simulation

O artigo propõe uma arquitetura de autoencoder baseada em aprendizado profundo para o quadro de computação distribuída aleatorizada (RDFC), visando minimizar a distância da variação total em relação a uma distribuição alvo desconhecida e demonstrando ganhos significativos em carga de comunicação em comparação com métodos de compressão de dados.

Didrik Bergström, Onur Günlü2026-03-12🔢 math

A PUF-Based Approach for Copy Protection of Intellectual Property in Neural Network Models

O artigo apresenta uma abordagem baseada em Funções de Hardware Inimitáveis (PUFs) para vincular os pesos de modelos de Redes Neurais às propriedades únicas do hardware subjacente, impedindo assim a execução precisa desses modelos em hardware clonado e protegendo a Propriedade Intelectual incorporada.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Martin Schwandtner, Hannes Sochor2026-03-12🤖 cs.LG

Prioritizing Gradient Sign Over Modulus: An Importance-Aware Framework for Wireless Federated Learning

O artigo propõe o SP-FL, um novo framework para aprendizado federado sem fio que prioriza a transmissão de sinais de gradiente e alocar recursos de forma desigual com base na importância dos dados, resultando em maior precisão em cenários com recursos limitados.

Yiyang Yue, Jiacheng Yao, Wei Xu, Zhaohui Yang, George K. Karagiannidis, Dusit Niyato2026-03-12⚡ eess

Dynamics-Informed Deep Learning for Predicting Extreme Events

Este artigo propõe um framework totalmente baseado em dados que combina modos OTD para identificar instabilidades transitórias eficientemente com modelos Transformer, permitindo a previsão de longo prazo de eventos extremos em sistemas caóticos de alta dimensão, como o fluxo de Kolmogorov, sem depender das equações governantes.

Eirini Katsidoniotaki, Themistoklis P. Sapsis2026-03-12🌀 nlin

← Anterior Próximo →