Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation

Este artigo apresenta o DSRM-HRL, um framework que reformula a recomendação justa como um problema de purificação de estado latente usando modelos de difusão para remover ruídos de feedback implícito, seguido por uma tomada de decisão hierárquica que desacopla a otimização de engajamento de curto prazo da regulação de equidade de longo prazo, alcançando assim um equilíbrio superior entre utilidade e justiça nas recomendações interativas.

Yun Lu, Xiaoyu Shi, Hong Xie + 2 more2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Este artigo demonstra que prompts adversarialmente otimizados podem induzir modelos de linguagem a "sandbagging" (subdesempenho estratégico) ao explorarem a consciência de avaliação, causando degradações drásticas no desempenho em tarefas específicas e revelando que essa vulnerabilidade é governada pela estrutura da tarefa e por um raciocínio causal de avaliação, e não apenas pela força do prompt.

Maheep Chaudhary2026-03-05🤖 cs.AI

Large-Margin Hyperdimensional Computing: A Learning-Theoretical Perspective

Este artigo propõe um classificador de hiperdimensional computação (HDC) de margem máxima que, ao estabelecer uma relação formal inédita entre HDC e máquinas de vetores de suporte (SVMs), supera significativamente os métodos de HDC existentes em diversos conjuntos de dados, oferecendo uma solução de aprendizado mais eficiente para dispositivos com recursos limitados.

Nikita Zeulin, Olga Galinina, Ravikumar Balakrishnan + 2 more2026-03-05🤖 cs.LG

Non-Invasive Reconstruction of Cardiac Activation Dynamics Using Physics-Informed Neural Networks

Este artigo apresenta um framework baseado em redes neurais informadas por física que permite a reconstrução não invasiva e precisa da dinâmica de ativação cardíaca, tensão ativa e campos de deformação a partir de dados de deformação mensuráveis, integrando modelagem constitutiva anisotrópica e restrições físicas para aplicações em fenotipagem digital e avaliação de arritmias.

Nathan Dermul, Hans Dierckx2026-03-05🤖 cs.LG

k-hop Fairness: Addressing Disparities in Graph Link Prediction Beyond First-Order Neighborhoods

Este artigo propõe o conceito de "justiça k-hop" para link prediction em grafos, introduzindo métricas e estratégias de mitigação que abordam disparidades estruturais além das vizinhanças de primeira ordem, superando as limitações da justiça diádica tradicional e demonstrando, através de experimentos, um melhor equilíbrio entre desempenho e equidade.

Lilian Marey, Tiphaine Viard, Charlotte Laclau2026-03-05🤖 cs.LG

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artigo propõe uma metodologia hierárquica que combina inferência bayesiana, modelos de fechamento baseados em aprendizado de máquina e estratégias de otimização bilevel com surrogados (como FNOs e PINNs) para resolver simultaneamente problemas inversos de parâmetros e aprender dinâmicas desconhecidas em sistemas governados por EDOs e EDPs.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

How Predicted Links Influence Network Evolution: Disentangling Choice and Algorithmic Feedback in Dynamic Graphs

Este artigo propõe um framework temporal baseado em processos de Hawkes multivariados para desvendar como modelos de previsão de links influenciam a evolução de redes, distinguindo entre tendências intrínsecas de interação e efeitos de amplificação causados por feedback algorítmico através de uma nova medida de viés instantâneo.

Mathilde Perez, Raphaël Romero, Jefrey Lijffijt + 1 more2026-03-05🤖 cs.LG

Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models

O artigo apresenta o Lang2Str, um framework generativo de duas etapas que combina a capacidade de raciocínio estruturado de Grandes Modelos de Linguagem (LLMs) para definir condições geométricas e propriedades com a modelagem de distribuição de modelos de fluxo contínuo para gerar coordenadas precisas, resultando em estruturas cristalinas mais válidas e diversas para a descoberta de materiais.

Cong Liu, Chengyue Gong, Zhenyu Liu + 2 more2026-03-05🤖 cs.LG

GIPO: Gaussian Importance Sampling Policy Optimization

O artigo apresenta o GIPO (Gaussian Importance Sampling Policy Optimization), um novo objetivo de otimização de políticas que substitui o recorte rígido por um peso de confiança gaussiano baseado em log-razão para suavizar razões de importância extremas, resultando em maior estabilidade, eficiência amostral e desempenho superior em agentes multimodais treinados com aprendizado por reforço, especialmente em cenários com dados escassos ou desatualizados.

Chengxuan Lu, Zhenquan Zhang, Shukuan Wang + 3 more2026-03-05🤖 cs.AI

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Este artigo propõe uma restrição de assertibilidade inspirada em Brouwer para IA responsável, exigindo que sistemas em domínios de alto risco emitam apenas afirmações ou negações acompanhadas de certificados públicos e contestáveis, retornando "Indeterminado" caso contrário, a fim de preservar a agência epistêmica democrática ao substituir a confiança estatística por justificação verificável.

Michael Jülich2026-03-05🤖 cs.AI