XConv: Low-memory stochastic backpropagation for convolutional layers

O artigo propõe o XConv, uma camada de convolução de substituição direta que reduz significativamente o uso de memória durante o treinamento de redes neurais convolucionais ao armazenar ativações comprimidas e aproximar gradientes via estimativa de traço aleatória, mantendo a compatibilidade com arquiteturas existentes e garantindo desempenho comparável aos métodos de gradiente exato.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. HerrmannWed, 11 Ma🤖 cs.LG

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Este artigo propõe um quadro unificado que modela a quantização e a esparsificação como ruído aditivo e introduz uma transformada de dequantização por dedução para estabelecer um caminho de gradiente explícito, permitindo o treinamento estável e robusto de redes neurais em precisões arbitrárias e níveis de esparsidade, incluindo regimes sub-bit e A1W1.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

Stochastic and incremental subgradient methods for convex optimization on Hadamard spaces

Este artigo introduz um novo tipo de subgradiente baseado em funções de Busemann para espaços de Hadamard, permitindo a generalização de métodos estocásticos e incrementais de subgradiente com limites de complexidade garantidos para problemas de otimização convexa, como o cálculo de médias pp e medianas em espaços de árvores BHV.

Ariel Goodwin, Adrian S. Lewis, Genaro López-Acedo, Adriana NicolaeWed, 11 Ma🔢 math

On the Conjecture of Stability Preservation in Arbitrary-Order Adams-Bashforth-Type Integrators

Este artigo refuta a conjectura de que o esquema de integração explícito de alta ordem proposto por Buvoli mantém estabilidade à medida que a precisão tende ao infinito, demonstrando, através de análise harmônica, que a estabilidade é perdida, ao mesmo tempo em que estabelece critérios para a precisão máxima permitida e oferece uma estratégia unificada de análise de estabilidade L2L^2 para EDPs parabólicas.

Daopeng Yin, Liquan MeiWed, 11 Ma🔢 math

Strong convergence of finite element approximations for a fourth-order stochastic pseudo-parabolic equation with additive noise

Este artigo analisa a aproximação por elementos finitos semi-discreta e a discretização completa de uma equação pseudo-parabólica estocástica de quarta ordem com ruído aditivo, estabelecendo taxas de convergência forte em relação aos tamanhos das malhas espaciais e temporais, as quais são validadas por experimentos numéricos.

Suprio Bhar, Mrinmay Biswas, Mangala PrasadWed, 11 Ma🔢 math-ph

A fast direct solver for two-dimensional transmission problems of elastic waves

Este artigo apresenta um solver direto rápido baseado no método dos elementos de contorno para problemas de transmissão de ondas elásticas bidimensionais, que utiliza equações integrais de Burton-Miller e PMCHWT com aproximação de baixo posto via método de proxy para contornar limitações de pré-condicionamento e alcançar complexidade computacional linear, sendo particularmente eficiente e versátil para inclusões de diversas formas.

Yasuhiro Matsumoto, Taizo MaruyamaWed, 11 Ma🔢 math

Efficient and Flexible Multirate Temporal Adaptivity

Este trabalho apresenta duas novas famílias de controladores de adaptabilidade temporal multirrate para métodos de integração MRI, que, combinados com novos embeddings de ordem até cinco para métodos MERK, permitem simulações adaptativas eficientes e flexíveis de problemas com múltiplas escalas de tempo, superando significativamente as abordagens existentes em desempenho e precisão.

Daniel R. Reynolds, Sylvia Amihere, Dashon Mitchell, Vu Thai LuanWed, 11 Ma🔢 math

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabalho desenvolveu uma estrutura de Redes Neurais Informadas por Física (PINN) para a reconstrução robusta de variáveis de estado ocultas e a estimativa de parâmetros biofísicos em modelos neuronais multiescala, superando as limitações de métodos tradicionais que dependem de solvers numéricos ao lidar com não-linearidades fortes e dados observacionais parciais e ruidosos.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

A finite element continuous data assimilation framework for a Navier--Stokes--Cahn--Hilliard system

Este artigo apresenta um quadro de assimilação de dados contínuo baseado em "nudging" para um sistema acoplado de Navier-Stokes-Cahn-Hilliard com um campo auxiliar, formulando um esquema de elementos finitos com divisão temporal que garante a recuperação de trajetórias a partir de observações espaciais grosseiras e demonstrando a sincronização do sistema com a dinâmica de referência através de experimentos numéricos.

Tianyu SunWed, 11 Ma🔢 math

Quantum algorithm for anisotropic diffusion and convection equations with vector norm scaling

Este trabalho apresenta um esquema numérico quântico para resolver equações de difusão e convecção anisotrópicas, demonstrando que uma nova análise de norma vetorial permite reduzir exponencialmente o número de passos temporais necessários em comparação com a análise de norma de operador tradicional.

Julien Zylberman, Thibault Fredon, Nuno F. Loureiro, Fabrice DebbaschWed, 11 Ma⚛️ quant-ph

Overlapping Schwarz Preconditioners for Pose-Graph SLAM in Robotics

Este artigo investiga o uso do método de decomposição de domínio de Schwarz sobreposto aditivo como pré-condicionador escalável para resolver os sistemas lineares esparsos gerados na otimização de grafos de pose em SLAM, demonstrando experimentalmente que o número de iterações do método do gradiente conjugado permanece limitado independentemente do tamanho do problema.

Stephan Köhler, Oliver Rheinbach, Yue Xiang Tee, Sebastian ZugWed, 11 Ma🔢 math