Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artigo propõe uma metodologia hierárquica que combina inferência bayesiana, modelos de fechamento baseados em aprendizado de máquina e estratégias de otimização bilevel com surrogados (como FNOs e PINNs) para resolver simultaneamente problemas inversos de parâmetros e aprender dinâmicas desconhecidas em sistemas governados por EDOs e EDPs.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

How Predicted Links Influence Network Evolution: Disentangling Choice and Algorithmic Feedback in Dynamic Graphs

Este artigo propõe um framework temporal baseado em processos de Hawkes multivariados para desvendar como modelos de previsão de links influenciam a evolução de redes, distinguindo entre tendências intrínsecas de interação e efeitos de amplificação causados por feedback algorítmico através de uma nova medida de viés instantâneo.

Mathilde Perez, Raphaël Romero, Jefrey Lijffijt + 1 more2026-03-05🤖 cs.LG

Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models

O artigo apresenta o Lang2Str, um framework generativo de duas etapas que combina a capacidade de raciocínio estruturado de Grandes Modelos de Linguagem (LLMs) para definir condições geométricas e propriedades com a modelagem de distribuição de modelos de fluxo contínuo para gerar coordenadas precisas, resultando em estruturas cristalinas mais válidas e diversas para a descoberta de materiais.

Cong Liu, Chengyue Gong, Zhenyu Liu + 2 more2026-03-05🤖 cs.LG

GIPO: Gaussian Importance Sampling Policy Optimization

O artigo apresenta o GIPO (Gaussian Importance Sampling Policy Optimization), um novo objetivo de otimização de políticas que substitui o recorte rígido por um peso de confiança gaussiano baseado em log-razão para suavizar razões de importância extremas, resultando em maior estabilidade, eficiência amostral e desempenho superior em agentes multimodais treinados com aprendizado por reforço, especialmente em cenários com dados escassos ou desatualizados.

Chengxuan Lu, Zhenquan Zhang, Shukuan Wang + 3 more2026-03-05🤖 cs.AI

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Este artigo propõe uma restrição de assertibilidade inspirada em Brouwer para IA responsável, exigindo que sistemas em domínios de alto risco emitam apenas afirmações ou negações acompanhadas de certificados públicos e contestáveis, retornando "Indeterminado" caso contrário, a fim de preservar a agência epistêmica democrática ao substituir a confiança estatística por justificação verificável.

Michael Jülich2026-03-05🤖 cs.AI

Specialization of softmax attention heads: insights from the high-dimensional single-location model

Este artigo propõe um modelo teórico que explica a especialização dinâmica das cabeças de atenção em transformadores, demonstrando como elas se alinham sequencialmente a direções de sinal durante o treinamento e como funções de ativação específicas, como o softmax-1 e o Bayes-softmax, podem reduzir ruído e otimizar o desempenho preditivo.

M. Sagitova, O. Duranthon, L. Zdeborová2026-03-05🤖 cs.LG

Spectral Surgery: Training-Free Refinement of LoRA via Gradient-Guided Singular Value Reweighting

O artigo propõe a "Spectral Surgery", um método pós-treinamento livre de treinamento que aprimora adaptadores LoRA existentes ao decompor suas atualizações via SVD e reponderar seus valores singulares com base na sensibilidade dos gradientes, resultando em ganhos consistentes de desempenho em diversas tarefas sem necessidade de retreinamento.

Zailong Tian, Yanzhe Chen, Zhuoheng Han + 1 more2026-03-05🤖 cs.AI

On the Learnability of Offline Model-Based Optimization: A Ranking Perspective

Este trabalho desafia a premissa de que a precisão preditiva é essencial para a otimização baseada em modelos offline, propondo uma perspectiva de aprendizado focada em classificação (ranking) que identifica a discrepância distribucional como a principal fonte de erro e introduz um método que supera vinte abordagens existentes ao mesmo tempo em que revela limitações intrínsecas na extrapolação otimista.

Shen-Huan Lyu, Rong-Xi Tan, Ke Xue + 4 more2026-03-05🤖 cs.LG

Continuous Modal Logical Neural Networks: Modal Reasoning via Stochastic Accessibility

O artigo propõe a "Fluid Logic", um paradigma que utiliza Equações Diferenciais Estocásticas Neurais para elevar o raciocínio modal lógico de estruturas Kripke discretas para variedades contínuas, permitindo que Redes Neurais Lógicas Informadas (LINNs) integrem operadores modais diretamente na função de perda para gerar soluções estruturalmente consistentes em domínios como lógica epistêmica, temporal e deôntica.

Antonin Sulc2026-03-05🤖 cs.LG

A Multi-Dimensional Quality Scoring Framework for Decentralized LLM Inference with Proof of Quality

Este artigo propõe um framework de pontuação de qualidade multidimensional para inferência descentralizada de LLMs, que, após calibração e remoção de dimensões não confiáveis, gera um sinal de qualidade composto que supera avaliadores individuais e se integra eficazmente a mecanismos de Prova de Qualidade (PoQ) para incentivos robustos.

Arther Tian, Alex Ding, Frank Chen + 2 more2026-03-05🤖 cs.AI