cs.LG artigos | Gist.Science

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation

Este artigo apresenta o DSRM-HRL, um framework que reformula a recomendação justa como um problema de purificação de estado latente usando modelos de difusão para remover ruídos de feedback implícito, seguido por uma tomada de decisão hierárquica que desacopla a otimização de engajamento de curto prazo da regulação de equidade de longo prazo, alcançando assim um equilíbrio superior entre utilidade e justiça nas recomendações interativas.

Yun Lu, Xiaoyu Shi, Hong Xie + 2 more2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Este artigo demonstra que prompts adversarialmente otimizados podem induzir modelos de linguagem a "sandbagging" (subdesempenho estratégico) ao explorarem a consciência de avaliação, causando degradações drásticas no desempenho em tarefas específicas e revelando que essa vulnerabilidade é governada pela estrutura da tarefa e por um raciocínio causal de avaliação, e não apenas pela força do prompt.

Maheep Chaudhary2026-03-05🤖 cs.AI

Large-Margin Hyperdimensional Computing: A Learning-Theoretical Perspective

Este artigo propõe um classificador de hiperdimensional computação (HDC) de margem máxima que, ao estabelecer uma relação formal inédita entre HDC e máquinas de vetores de suporte (SVMs), supera significativamente os métodos de HDC existentes em diversos conjuntos de dados, oferecendo uma solução de aprendizado mais eficiente para dispositivos com recursos limitados.

Nikita Zeulin, Olga Galinina, Ravikumar Balakrishnan + 2 more2026-03-05🤖 cs.LG

Non-Invasive Reconstruction of Cardiac Activation Dynamics Using Physics-Informed Neural Networks

Este artigo apresenta um framework baseado em redes neurais informadas por física que permite a reconstrução não invasiva e precisa da dinâmica de ativação cardíaca, tensão ativa e campos de deformação a partir de dados de deformação mensuráveis, integrando modelagem constitutiva anisotrópica e restrições físicas para aplicações em fenotipagem digital e avaliação de arritmias.

Nathan Dermul, Hans Dierckx2026-03-05🤖 cs.LG

Invariance-Based Dynamic Regret Minimization

O artigo propõe o algoritmo ISD-linUCB para banditos lineares não estacionários, que melhora o desempenho ao decompor o modelo de recompensa em componentes estacionários e não estacionários, permitindo o aproveitamento de dados históricos para identificar invariâncias e reduzir a dimensionalidade do problema.

Margherita Lazzaretto, Jonas Peters, Niklas Pfister2026-03-05🤖 cs.LG

Structure-Aware Distributed Backdoor Attacks in Federated Learning

Este artigo propõe uma perspectiva consciente da estrutura em ataques backdoor distribuídos no aprendizado federado, demonstrando que a arquitetura do modelo e sua compatibilidade com perturbações fractais influenciam decisivamente a eficácia do ataque, superando a visão tradicional focada apenas no design do gatilho ou na intensidade do envenenamento.

Wang Jian, Shen Hong, Ke Wei + 1 more2026-03-05🤖 cs.AI

k-hop Fairness: Addressing Disparities in Graph Link Prediction Beyond First-Order Neighborhoods

Este artigo propõe o conceito de "justiça k-hop" para link prediction em grafos, introduzindo métricas e estratégias de mitigação que abordam disparidades estruturais além das vizinhanças de primeira ordem, superando as limitações da justiça diádica tradicional e demonstrando, através de experimentos, um melhor equilíbrio entre desempenho e equidade.

Lilian Marey, Tiphaine Viard, Charlotte Laclau2026-03-05🤖 cs.LG

Believe Your Model: Distribution-Guided Confidence Calibration

O artigo apresenta o DistriVoting, um método que aprimora a seleção de respostas em Modelos de Raciocínio de Grande Escala ao decompor distribuições de confiança e ajustar dinamicamente o processo de inferência, superando abordagens atuais em diversos benchmarks.

Xizhong Yang, Haotian Zhang, Huiming Wang + 1 more2026-03-05🤖 cs.LG

IROSA: Interactive Robot Skill Adaptation using Natural Language

O artigo apresenta o IROSA, um novo framework que utiliza modelos de linguagem pré-treinados para adaptar habilidades de robôs industriais por meio de comandos em linguagem natural, mantendo uma camada de abstração segura que evita o ajuste fino do modelo e a interação direta com o hardware.

Markus Knauer, Samuel Bustamante, Thomas Eiband + 3 more2026-03-05🤖 cs.AI

PatchDecomp: Interpretable Patch-Based Time Series Forecasting

O artigo apresenta o PatchDecomp, um método de previsão de séries temporais baseado em redes neurais que divide os dados em subsequências para alcançar alta precisão e interpretabilidade, permitindo a atribuição clara da contribuição de cada segmento e variável exógena na previsão final.

Hiroki Tomioka, Genta Yoshimura2026-03-05🤖 cs.AI

From Misclassifications to Outliers: Joint Reliability Assessment in Classification

Este artigo propõe um novo framework unificado, métricas de avaliação (DS-F1 e DS-AURC) e o método SURE+ para avaliar e melhorar a confiabilidade de classificadores ao tratar conjuntamente a detecção de dados fora de distribuição e a previsão de falhas em dados dentro de distribuição.

Yang Li, Youyang Sha, Yinzhi Wang + 4 more2026-03-05🤖 cs.LG

BD-Merging: Bias-Aware Dynamic Model Merging with Evidence-Guided Contrastive Learning

O artigo apresenta o BD-Merging, um framework de fusão de modelos não supervisionado e consciente de viés que utiliza aprendizado contrastivo guiado por evidências e pontuação de discrepância para melhorar a confiabilidade e a generalização sob mudanças de distribuição em cenários de aprendizado multi-tarefa.

Yuhan Xie, Chen Lyu2026-03-05🤖 cs.AI

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artigo propõe uma metodologia hierárquica que combina inferência bayesiana, modelos de fechamento baseados em aprendizado de máquina e estratégias de otimização bilevel com surrogados (como FNOs e PINNs) para resolver simultaneamente problemas inversos de parâmetros e aprender dinâmicas desconhecidas em sistemas governados por EDOs e EDPs.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Selecting Offline Reinforcement Learning Algorithms for Stochastic Network Control

Este estudo avalia algoritmos de Aprendizado por Reforço Offline em ambientes de telecomunicações estocásticos, concluindo que o Conservative Q-Learning oferece a maior robustez como escolha padrão, enquanto métodos baseados em sequências podem superar abordagens Bellman quando há disponibilidade de trajetórias de alto retorno.

Nicolas Helson, Pegah Alizadeh, Anastasios Giovanidis2026-03-05🤖 cs.AI

How Predicted Links Influence Network Evolution: Disentangling Choice and Algorithmic Feedback in Dynamic Graphs

Este artigo propõe um framework temporal baseado em processos de Hawkes multivariados para desvendar como modelos de previsão de links influenciam a evolução de redes, distinguindo entre tendências intrínsecas de interação e efeitos de amplificação causados por feedback algorítmico através de uma nova medida de viés instantâneo.

Mathilde Perez, Raphaël Romero, Jefrey Lijffijt + 1 more2026-03-05🤖 cs.LG

Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models

O artigo apresenta o Lang2Str, um framework generativo de duas etapas que combina a capacidade de raciocínio estruturado de Grandes Modelos de Linguagem (LLMs) para definir condições geométricas e propriedades com a modelagem de distribuição de modelos de fluxo contínuo para gerar coordenadas precisas, resultando em estruturas cristalinas mais válidas e diversas para a descoberta de materiais.

Cong Liu, Chengyue Gong, Zhenyu Liu + 2 more2026-03-05🤖 cs.LG

GIPO: Gaussian Importance Sampling Policy Optimization

O artigo apresenta o GIPO (Gaussian Importance Sampling Policy Optimization), um novo objetivo de otimização de políticas que substitui o recorte rígido por um peso de confiança gaussiano baseado em log-razão para suavizar razões de importância extremas, resultando em maior estabilidade, eficiência amostral e desempenho superior em agentes multimodais treinados com aprendizado por reforço, especialmente em cenários com dados escassos ou desatualizados.

Chengxuan Lu, Zhenquan Zhang, Shukuan Wang + 3 more2026-03-05🤖 cs.AI

TFWaveFormer: Temporal-Frequency Collaborative Multi-level Wavelet Transformer for Dynamic Link Prediction

O artigo propõe o TFWaveFormer, uma nova arquitetura Transformer que integra análise temporal-frequencial com decomposição de wavelet multi-resolução para superar as limitações dos modelos existentes na previsão de links dinâmicos, alcançando desempenho superior em diversas métricas.

Hantong Feng, Yonggang Wu, Duxin Chen + 1 more2026-03-05🤖 cs.AI

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Este artigo propõe uma restrição de assertibilidade inspirada em Brouwer para IA responsável, exigindo que sistemas em domínios de alto risco emitam apenas afirmações ou negações acompanhadas de certificados públicos e contestáveis, retornando "Indeterminado" caso contrário, a fim de preservar a agência epistêmica democrática ao substituir a confiança estatística por justificação verificável.

Michael Jülich2026-03-05🤖 cs.AI

← Anterior Próximo →