Quantitative convergence of trained single layer neural networks to Gaussian processes

Este artigo estabelece limites superiores explícitos para a distância de Wasserstein quadrática entre redes neurais de camada única treinadas por descida de gradiente e seus processos gaussianos associados no limite de largura infinita, demonstrando um decaimento polinomial do erro de aproximação em função da largura da rede e quantificando a influência dos parâmetros arquitetônicos e da dinâmica de treinamento.

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Este trabalho demonstra empiricamente que, ao utilizar uma calibração adequada de temperatura softmax, simplesmente aumentar a largura do modelo é suficiente para alcançar a conectividade linear de modos (LMC) sem a necessidade de permutações de parâmetros, explicando esse fenômeno através da conectividade exponencialmente ponderada por camadas (LEWC) que faz com que o modelo fundido corresponda a um ensemble dos modelos originais.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

O artigo apresenta o CBF-RL, um framework que integra Funções de Barreira de Controle (CBFs) durante o treinamento de Aprendizado por Reforço para internalizar restrições de segurança na política aprendida, permitindo a implantação segura em robôs reais, como o Unitree G1, sem a necessidade de filtros de segurança em tempo real.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Este trabalho apresenta o B-ODIL, uma extensão bayesiana do método de otimização de perda discreta (ODIL) para resolver problemas inversos baseados em equações diferenciais parciais, permitindo a inferência de soluções com incertezas quantificadas, como demonstrado em benchmarks sintéticos e na estimativa da concentração de tumores cerebrais a partir de ressonâncias magnéticas.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Este artigo demonstra que as defesas atuais contra sequestro de fluxo de controle em sistemas multiagente são vulneráveis devido a conflitos fundamentais entre segurança e funcionalidade, propondo e avaliando o ControlValve, uma nova defesa que impõe integridade de fluxo de controle e o princípio do menor privilégio através de grafos de execução permitidos e regras contextuais.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Este artigo estabelece teoricamente que a geometria dos dados determina a capacidade de generalização de redes neurais ReLU superparametrizadas treinadas abaixo do limite de estabilidade, demonstrando que dados mais difíceis de "fragmentar" favorecem a aprendizagem de padrões compartilhados, enquanto dados facilmente fragmentáveis levam à memorização.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

O artigo apresenta o FMint-SDE, um modelo de fundação multimodal baseado em transformadores que utiliza aprendizado em contexto e correção de erros para acelerar e aprimorar a precisão da simulação de equações diferenciais estocásticas em diversos domínios científicos, superando as limitações de eficiência e generalização dos métodos tradicionais.

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math