Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Este trabalho demonstra empiricamente que, ao utilizar uma calibração adequada de temperatura softmax, simplesmente aumentar a largura do modelo é suficiente para alcançar a conectividade linear de modos (LMC) sem a necessidade de permutações de parâmetros, explicando esse fenômeno através da conectividade exponencialmente ponderada por camadas (LEWC) que faz com que o modelo fundido corresponda a um ensemble dos modelos originais.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

O artigo apresenta o CBF-RL, um framework que integra Funções de Barreira de Controle (CBFs) durante o treinamento de Aprendizado por Reforço para internalizar restrições de segurança na política aprendida, permitindo a implantação segura em robôs reais, como o Unitree G1, sem a necessidade de filtros de segurança em tempo real.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Este trabalho apresenta o B-ODIL, uma extensão bayesiana do método de otimização de perda discreta (ODIL) para resolver problemas inversos baseados em equações diferenciais parciais, permitindo a inferência de soluções com incertezas quantificadas, como demonstrado em benchmarks sintéticos e na estimativa da concentração de tumores cerebrais a partir de ressonâncias magnéticas.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Este artigo demonstra que as defesas atuais contra sequestro de fluxo de controle em sistemas multiagente são vulneráveis devido a conflitos fundamentais entre segurança e funcionalidade, propondo e avaliando o ControlValve, uma nova defesa que impõe integridade de fluxo de controle e o princípio do menor privilégio através de grafos de execução permitidos e regras contextuais.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Este artigo estabelece teoricamente que a geometria dos dados determina a capacidade de generalização de redes neurais ReLU superparametrizadas treinadas abaixo do limite de estabilidade, demonstrando que dados mais difíceis de "fragmentar" favorecem a aprendizagem de padrões compartilhados, enquanto dados facilmente fragmentáveis levam à memorização.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

O artigo apresenta o FMint-SDE, um modelo de fundação multimodal baseado em transformadores que utiliza aprendizado em contexto e correção de erros para acelerar e aprimorar a precisão da simulação de equações diferenciais estocásticas em diversos domínios científicos, superando as limitações de eficiência e generalização dos métodos tradicionais.

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

O artigo apresenta o FlashCache, um novo framework de compressão de cache KV para modelos de linguagem multimodal que utiliza uma abordagem guiada por domínio de frequência para identificar e preservar outliers críticos, resultando em uma aceleração de decodificação de até 1,69 vezes e uma redução de 80% no uso de memória sem comprometer o desempenho.

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

O artigo propõe o ObAct, um novo framework de aprendizado por imitação com visão ativa que utiliza um braço robótico como observador para construir uma representação 3DGS e encontrar a melhor posição de câmera, permitindo que o braço executor atue com observações mais claras e resultando em políticas significativamente mais robustas do que em configurações com câmeras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs