cs.LG artigos | Gist.Science

Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Este artigo apresenta o Whisperer, um framework de prompting visual que utiliza um pré-processador baseado em difusão e um currículo de clonagem comportamental para melhorar significativamente a precisão de modelos OCR congelados ao aprender a transformar pixel a pixel imagens degradadas, reduzindo a taxa de erro de caracteres em 8% sem ajustar os pesos do modelo original.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Este estudo demonstra que, para otimizar a detecção de distribuição fora do domínio (OOD) em Vision Transformers, a melhor estratégia é combinar a sondagem de camadas intermediárias com a seleção específica de módulos, utilizando as ativações da rede feedforward sob grandes deslocamentos de distribuição e a saída normalizada da atenção multi-cabeça quando o deslocamento é fraco.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Bayesian Supervised Causal Clustering

O artigo propõe o método de Agrupamento Causal Supervisionado Bayesiano (BSCC), que utiliza o efeito do tratamento para identificar subgrupos de pacientes homogêneos tanto em seus perfis de covariáveis quanto na resposta à intervenção, validando sua eficácia em dados simulados e reais do Terceiro Ensaio Internacional de AVC.

Luwei Wang, Nazir Lone, Sohan Seth2026-03-06🤖 cs.LG

Knowledge Divergence and the Value of Debate for Scalable Oversight

Este artigo estabelece uma conexão formal entre debate e RLAIF, demonstrando que o valor do debate para a supervisão escalável de IA depende geometricamente da divergência de conhecimento entre os modelos, variando de regimes onde é desnecessário a outros onde é essencial para acessar informações latentes inacessíveis a um único agente.

Robin Young2026-03-06🤖 cs.LG

Latent Policy Steering through One-Step Flow Policies

O artigo propõe a Latent Policy Steering (LPS), um método de aprendizado por reforço offline que alcança desempenho de ponta em tarefas robóticas ao eliminar críticos latentes proxy e permitir a otimização direta no espaço latente através de um policy de MeanFlow de um passo, garantindo assim a melhoria da política com fidelidade e estabilidade sem necessidade de ajuste fino de hiperparâmetros.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

O artigo apresenta o WavSLM, um modelo de linguagem de fala de fluxo único que, ao quantizar e destilar representações do WavLM em um único código e otimizar a previsão autoregressiva de próximos blocos, consegue modelar conjuntamente informações semânticas e acústicas sem supervisão textual, alcançando desempenho competitivo com menos parâmetros e dados.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Este artigo propõe o uso de valores de Shapley assimétricos como uma métrica de importância de recursos mais adequada e honesta para avaliar o impacto de dados genômicos de alta dimensão em modelos preditivos clínicos, superando as limitações de abordagens tradicionais ao lidar com colinearidade e direcionalidade de dependências, com validação prática na previsão da sobrevivência livre de progressão em pacientes com câncer colorretal.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

O artigo apresenta o GALACTIC, o primeiro framework unificado que gera explicações contrafactuais locais e globais para agrupamento de séries temporais não supervisionado, utilizando otimização sensível a clusters e um algoritmo guloso baseado em MDL para produzir perturbações esparsas e resumos interpretáveis das transições entre clusters.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI

FairFinGAN: Fairness-aware Synthetic Financial Data Generation

O artigo apresenta o FairFinGAN, um framework baseado em WGAN que gera dados financeiros sintéticos mitigando viés em relação a atributos protegidos enquanto preserva a utilidade dos dados para tarefas preditivas.

Tai Le Quy, Dung Nguyen Tuan, Trung Nguyen Thanh + 3 more2026-03-06🤖 cs.LG

Bayes with No Shame: Admissibility Geometries of Predictive Inference

Este artigo demonstra que a admissibilidade na inferência preditiva é irreducivelmente relativa ao critério adotado, estabelecendo que quatro geometrias distintas — dominância de risco de Blackwell, admissibilidade válida a qualquer momento, validade de cobertura marginal e admissibilidade de aproximação de Cesàro — definem classes de procedimentos não aninhadas, cada uma com sua própria certificação de otimalidade e restrições geométricas incompatíveis.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

On the Statistical Optimality of Optimal Decision Trees

Este trabalho estabelece uma teoria estatística abrangente para árvores de decisão de minimização de risco empírico (ERM), demonstrando sua otimalidade através de desigualdades de oráculo afiadas e taxas minimax ótimas em um novo espaço funcional que captura esparsidade, suavidade anisotrópica e heterogeneidade espacial, mesmo sob ruídos pesados.

Zineng Xu, Subhroshekhar Ghosh, Yan Shuo Tan2026-03-06🔢 math

Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs

Este trabalho propõe o quadro de Quantização Consciente da Geometria (GAQ), que preserva rigorosamente a simetria contínua SO(3) em Redes Neurais de Grafos Equivariantes através de esquemas de quantização desacoplados e estratégias de treinamento adaptadas, permitindo simulações moleculares precisas e energeticamente conservadoras com redução significativa de memória e aceleração de inferência.

Haoyu Zhou, Ping Xue, Hao Zhang + 1 more2026-03-06🤖 cs.LG

InfoFlow KV: Information-Flow-Aware KV Recomputation for Long Context

O artigo "InfoFlow KV" propõe um método de recomputação de cache KV orientado ao fluxo de informação, que utiliza um sinal de norma de atenção para identificar e reordenar tokens semanticamente relevantes e estruturalmente posicionados, melhorando a eficiência e a precisão da geração em contextos longos para modelos de linguagem e visão.

Xin Teng, Canyu Zhang, Shaoyi Zheng + 3 more2026-03-06🤖 cs.LG

Learning Causal Structure of Time Series using Best Order Score Search

Este artigo apresenta o TS-BOSS, uma extensão do algoritmo BOSS para séries temporais que utiliza busca baseada em permutações e árvores de crescimento-encolhimento para aprender estruturas causais de forma escalável e com alto desempenho, especialmente em regimes de alta autocorrelação.

Irene Gema Castillo Mansilla, Urmi Ninad2026-03-06🤖 cs.AI

Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition

Este artigo propõe um novo quadro adversarial profundo que integra a variabilidade inter-sujeito para gerar representações de características invariantes ao indivíduo, melhorando significativamente a generalização e o desempenho na Reconhecimento de Atividades Humanas (HAR) com sensores inerciais.

Francisco M. Calatrava-Nicolás, Shoko Miyauchi, Vitor Fortes Rey + 3 more2026-03-06🤖 cs.LG

Robust Node Affinities via Jaccard-Biased Random Walks and Rank Aggregation

O artigo apresenta o TopKGraphs, um método não paramétrico e interpretável que estima a similaridade entre nós em redes através de passeios aleatórios enviesados pela similaridade de Jaccard e agregação robusta de rankings, demonstrando desempenho superior ou competitivo em diversos cenários de análise de redes e aprendizado de máquina.

Bastian Pfeifer, Michael G. Schimek2026-03-06🤖 cs.LG

On the Necessity of Learnable Sheaf Laplacians

Este artigo demonstra que, em redes neurais de feixe (SNNs), a complexidade adicional de aprender mapas de restrição é desnecessária, uma vez que uma versão simplificada com mapas fixos como identidade alcança desempenho comparável em grafos heterofílicos e não sofre de mais *oversmoothing* do que as variantes aprendidas.

Ferran Hernandez Caralt, Mar GonzÃ lez i CatalÃ, Adrián Bazaga + 1 more2026-03-06🤖 cs.LG

Harnessing Synthetic Data from Generative AI for Statistical Inference

Este artigo revisa o panorama atual da geração e utilização de dados sintéticos por meio de IA generativa sob uma perspectiva estatística, identificando pressupostos, limitações e armadilhas para estabelecer diretrizes e recomendações práticas sobre seu uso válido e confiável em inferência e descoberta científica.

Ahmad Abdel-Azim, Ruoyu Wang, Xihong Lin2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

O artigo apresenta o MobileFetalCLIP, um modelo de aprendizado profundo leve que utiliza uma técnica inovadora de destilação de conhecimento repulsiva seletiva para superar as limitações de capacidade de modelos maiores, permitindo a análise em tempo real de ultrassons fetais em dispositivos móveis com desempenho superior ao do modelo professor.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

An interpretable prototype parts-based neural network for medical tabular data

Este artigo propõe uma rede neural baseada em protótipos interpretáveis para dados tabulares médicos, que utiliza "patches" treináveis sobre características discretizadas para gerar previsões transparentes e alinhadas com a linguagem clínica, alcançando desempenho competitivo sem sacrificar a interpretabilidade.

Jacek Karolczak, Jerzy Stefanowski2026-03-06🤖 cs.LG

← Anterior Próximo →