cs.LG artigos | Gist.Science

Believe Your Model: Distribution-Guided Confidence Calibration

O artigo apresenta o DistriVoting, um método que aprimora a seleção de respostas em Modelos de Raciocínio de Grande Escala ao decompor distribuições de confiança e ajustar dinamicamente o processo de inferência, superando abordagens atuais em diversos benchmarks.

Xizhong Yang, Haotian Zhang, Huiming Wang + 1 more2026-03-05🤖 cs.LG

IROSA: Interactive Robot Skill Adaptation using Natural Language

O artigo apresenta o IROSA, um novo framework que utiliza modelos de linguagem pré-treinados para adaptar habilidades de robôs industriais por meio de comandos em linguagem natural, mantendo uma camada de abstração segura que evita o ajuste fino do modelo e a interação direta com o hardware.

Markus Knauer, Samuel Bustamante, Thomas Eiband + 3 more2026-03-05🤖 cs.AI

PatchDecomp: Interpretable Patch-Based Time Series Forecasting

O artigo apresenta o PatchDecomp, um método de previsão de séries temporais baseado em redes neurais que divide os dados em subsequências para alcançar alta precisão e interpretabilidade, permitindo a atribuição clara da contribuição de cada segmento e variável exógena na previsão final.

Hiroki Tomioka, Genta Yoshimura2026-03-05🤖 cs.AI

From Misclassifications to Outliers: Joint Reliability Assessment in Classification

Este artigo propõe um novo framework unificado, métricas de avaliação (DS-F1 e DS-AURC) e o método SURE+ para avaliar e melhorar a confiabilidade de classificadores ao tratar conjuntamente a detecção de dados fora de distribuição e a previsão de falhas em dados dentro de distribuição.

Yang Li, Youyang Sha, Yinzhi Wang + 4 more2026-03-05🤖 cs.LG

BD-Merging: Bias-Aware Dynamic Model Merging with Evidence-Guided Contrastive Learning

O artigo apresenta o BD-Merging, um framework de fusão de modelos não supervisionado e consciente de viés que utiliza aprendizado contrastivo guiado por evidências e pontuação de discrepância para melhorar a confiabilidade e a generalização sob mudanças de distribuição em cenários de aprendizado multi-tarefa.

Yuhan Xie, Chen Lyu2026-03-05🤖 cs.AI

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Este artigo propõe uma metodologia hierárquica que combina inferência bayesiana, modelos de fechamento baseados em aprendizado de máquina e estratégias de otimização bilevel com surrogados (como FNOs e PINNs) para resolver simultaneamente problemas inversos de parâmetros e aprender dinâmicas desconhecidas em sistemas governados por EDOs e EDPs.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Selecting Offline Reinforcement Learning Algorithms for Stochastic Network Control

Este estudo avalia algoritmos de Aprendizado por Reforço Offline em ambientes de telecomunicações estocásticos, concluindo que o Conservative Q-Learning oferece a maior robustez como escolha padrão, enquanto métodos baseados em sequências podem superar abordagens Bellman quando há disponibilidade de trajetórias de alto retorno.

Nicolas Helson, Pegah Alizadeh, Anastasios Giovanidis2026-03-05🤖 cs.AI

How Predicted Links Influence Network Evolution: Disentangling Choice and Algorithmic Feedback in Dynamic Graphs

Este artigo propõe um framework temporal baseado em processos de Hawkes multivariados para desvendar como modelos de previsão de links influenciam a evolução de redes, distinguindo entre tendências intrínsecas de interação e efeitos de amplificação causados por feedback algorítmico através de uma nova medida de viés instantâneo.

Mathilde Perez, Raphaël Romero, Jefrey Lijffijt + 1 more2026-03-05🤖 cs.LG

Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models

O artigo apresenta o Lang2Str, um framework generativo de duas etapas que combina a capacidade de raciocínio estruturado de Grandes Modelos de Linguagem (LLMs) para definir condições geométricas e propriedades com a modelagem de distribuição de modelos de fluxo contínuo para gerar coordenadas precisas, resultando em estruturas cristalinas mais válidas e diversas para a descoberta de materiais.

Cong Liu, Chengyue Gong, Zhenyu Liu + 2 more2026-03-05🤖 cs.LG

GIPO: Gaussian Importance Sampling Policy Optimization

O artigo apresenta o GIPO (Gaussian Importance Sampling Policy Optimization), um novo objetivo de otimização de políticas que substitui o recorte rígido por um peso de confiança gaussiano baseado em log-razão para suavizar razões de importância extremas, resultando em maior estabilidade, eficiência amostral e desempenho superior em agentes multimodais treinados com aprendizado por reforço, especialmente em cenários com dados escassos ou desatualizados.

Chengxuan Lu, Zhenquan Zhang, Shukuan Wang + 3 more2026-03-05🤖 cs.AI

TFWaveFormer: Temporal-Frequency Collaborative Multi-level Wavelet Transformer for Dynamic Link Prediction

O artigo propõe o TFWaveFormer, uma nova arquitetura Transformer que integra análise temporal-frequencial com decomposição de wavelet multi-resolução para superar as limitações dos modelos existentes na previsão de links dinâmicos, alcançando desempenho superior em diversas métricas.

Hantong Feng, Yonggang Wu, Duxin Chen + 1 more2026-03-05🤖 cs.AI

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Este artigo propõe uma restrição de assertibilidade inspirada em Brouwer para IA responsável, exigindo que sistemas em domínios de alto risco emitam apenas afirmações ou negações acompanhadas de certificados públicos e contestáveis, retornando "Indeterminado" caso contrário, a fim de preservar a agência epistêmica democrática ao substituir a confiança estatística por justificação verificável.

Michael Jülich2026-03-05🤖 cs.AI

Dual-Solver: A Generalized ODE Solver for Diffusion Models with Dual Prediction

O artigo apresenta o Dual-Solver, um solucionador de equações diferenciais generalizado para modelos de difusão que utiliza parâmetros aprendíveis para otimizar a amostragem em regimes de baixo custo computacional, melhorando significativamente a qualidade da geração de imagens em diversos modelos de base.

Soochul Park, Yeon Ju Lee2026-03-05🤖 cs.LG

Specialization of softmax attention heads: insights from the high-dimensional single-location model

Este artigo propõe um modelo teórico que explica a especialização dinâmica das cabeças de atenção em transformadores, demonstrando como elas se alinham sequencialmente a direções de sinal durante o treinamento e como funções de ativação específicas, como o softmax-1 e o Bayes-softmax, podem reduzir ruído e otimizar o desempenho preditivo.

M. Sagitova, O. Duranthon, L. Zdeborová2026-03-05🤖 cs.LG

Spectral Surgery: Training-Free Refinement of LoRA via Gradient-Guided Singular Value Reweighting

O artigo propõe a "Spectral Surgery", um método pós-treinamento livre de treinamento que aprimora adaptadores LoRA existentes ao decompor suas atualizações via SVD e reponderar seus valores singulares com base na sensibilidade dos gradientes, resultando em ganhos consistentes de desempenho em diversas tarefas sem necessidade de retreinamento.

Zailong Tian, Yanzhe Chen, Zhuoheng Han + 1 more2026-03-05🤖 cs.AI

On the Learnability of Offline Model-Based Optimization: A Ranking Perspective

Este trabalho desafia a premissa de que a precisão preditiva é essencial para a otimização baseada em modelos offline, propondo uma perspectiva de aprendizado focada em classificação (ranking) que identifica a discrepância distribucional como a principal fonte de erro e introduz um método que supera vinte abordagens existentes ao mesmo tempo em que revela limitações intrínsecas na extrapolação otimista.

Shen-Huan Lyu, Rong-Xi Tan, Ke Xue + 4 more2026-03-05🤖 cs.LG

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Este trabalho propõe um framework livre de treinamento que utiliza modelos de difusão pré-treinados, integrando codificação de canal reversa e um decodificador ODE escalado por pontuação, para navegar de forma ótima e adaptativa em todo o espectro de tradeoffs entre taxa, distorção e percepção na compressão com perdas.

Yuhan Wang, Suzhi Bi, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Este artigo investiga a identificação do melhor braço sob restrição de orçamento fixo em banditos agrupados, propondo o algoritmo FCSR que garante a viabilidade de todas as atributos e demonstra desempenho ótimo e superior a baselines naturais.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Continuous Modal Logical Neural Networks: Modal Reasoning via Stochastic Accessibility

O artigo propõe a "Fluid Logic", um paradigma que utiliza Equações Diferenciais Estocásticas Neurais para elevar o raciocínio modal lógico de estruturas Kripke discretas para variedades contínuas, permitindo que Redes Neurais Lógicas Informadas (LINNs) integrem operadores modais diretamente na função de perda para gerar soluções estruturalmente consistentes em domínios como lógica epistêmica, temporal e deôntica.

Antonin Sulc2026-03-05🤖 cs.LG

A Multi-Dimensional Quality Scoring Framework for Decentralized LLM Inference with Proof of Quality

Este artigo propõe um framework de pontuação de qualidade multidimensional para inferência descentralizada de LLMs, que, após calibração e remoção de dimensões não confiáveis, gera um sinal de qualidade composto que supera avaliadores individuais e se integra eficazmente a mecanismos de Prova de Qualidade (PoQ) para incentivos robustos.

Arther Tian, Alex Ding, Frank Chen + 2 more2026-03-05🤖 cs.AI

← Anterior Próximo →