Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Este artigo apresenta o Whisperer, um framework de prompting visual que utiliza um pré-processador baseado em difusão e um currículo de clonagem comportamental para melhorar significativamente a precisão de modelos OCR congelados ao aprender a transformar pixel a pixel imagens degradadas, reduzindo a taxa de erro de caracteres em 8% sem ajustar os pesos do modelo original.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

Este estudo demonstra que, para otimizar a detecção de distribuição fora do domínio (OOD) em Vision Transformers, a melhor estratégia é combinar a sondagem de camadas intermediárias com a seleção específica de módulos, utilizando as ativações da rede feedforward sob grandes deslocamentos de distribuição e a saída normalizada da atenção multi-cabeça quando o deslocamento é fraco.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Latent Policy Steering through One-Step Flow Policies

O artigo propõe a Latent Policy Steering (LPS), um método de aprendizado por reforço offline que alcança desempenho de ponta em tarefas robóticas ao eliminar críticos latentes proxy e permitir a otimização direta no espaço latente através de um policy de MeanFlow de um passo, garantindo assim a melhoria da política com fidelidade e estabilidade sem necessidade de ajuste fino de hiperparâmetros.

Hokyun Im, Andrey Kolobov, Jianlong Fu + 1 more2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

O artigo apresenta o WavSLM, um modelo de linguagem de fala de fluxo único que, ao quantizar e destilar representações do WavLM em um único código e otimizar a previsão autoregressiva de próximos blocos, consegue modelar conjuntamente informações semânticas e acústicas sem supervisão textual, alcançando desempenho competitivo com menos parâmetros e dados.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features

Este artigo propõe o uso de valores de Shapley assimétricos como uma métrica de importância de recursos mais adequada e honesta para avaliar o impacto de dados genômicos de alta dimensão em modelos preditivos clínicos, superando as limitações de abordagens tradicionais ao lidar com colinearidade e direcionalidade de dependências, com validação prática na previsão da sobrevivência livre de progressão em pacientes com câncer colorretal.

Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum + 1 more2026-03-06🤖 cs.LG

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

O artigo apresenta o GALACTIC, o primeiro framework unificado que gera explicações contrafactuais locais e globais para agrupamento de séries temporais não supervisionado, utilizando otimização sensível a clusters e um algoritmo guloso baseado em MDL para produzir perturbações esparsas e resumos interpretáveis das transições entre clusters.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI

Bayes with No Shame: Admissibility Geometries of Predictive Inference

Este artigo demonstra que a admissibilidade na inferência preditiva é irreducivelmente relativa ao critério adotado, estabelecendo que quatro geometrias distintas — dominância de risco de Blackwell, admissibilidade válida a qualquer momento, validade de cobertura marginal e admissibilidade de aproximação de Cesàro — definem classes de procedimentos não aninhadas, cada uma com sua própria certificação de otimalidade e restrições geométricas incompatíveis.

Nicholas G. Polson, Daniel Zantedeschi2026-03-06🔢 math

Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs

Este trabalho propõe o quadro de Quantização Consciente da Geometria (GAQ), que preserva rigorosamente a simetria contínua SO(3) em Redes Neurais de Grafos Equivariantes através de esquemas de quantização desacoplados e estratégias de treinamento adaptadas, permitindo simulações moleculares precisas e energeticamente conservadoras com redução significativa de memória e aceleração de inferência.

Haoyu Zhou, Ping Xue, Hao Zhang + 1 more2026-03-06🤖 cs.LG

Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition

Este artigo propõe um novo quadro adversarial profundo que integra a variabilidade inter-sujeito para gerar representações de características invariantes ao indivíduo, melhorando significativamente a generalização e o desempenho na Reconhecimento de Atividades Humanas (HAR) com sensores inerciais.

Francisco M. Calatrava-Nicolás, Shoko Miyauchi, Vitor Fortes Rey + 3 more2026-03-06🤖 cs.LG

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

O artigo apresenta o MobileFetalCLIP, um modelo de aprendizado profundo leve que utiliza uma técnica inovadora de destilação de conhecimento repulsiva seletiva para superar as limitações de capacidade de modelos maiores, permitindo a análise em tempo real de ultrassons fetais em dispositivos móveis com desempenho superior ao do modelo professor.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI