SPyCer: Semi-Supervised Physics-Guided Contextual Attention for Near-Surface Air Temperature Estimation from Satellite Imagery

O artigo apresenta o SPyCer, uma rede semissupervisionada guiada por princípios físicos que utiliza atenção contextual e imagens de satélite para estimar com precisão e coerência física a temperatura do ar próxima à superfície, superando as limitações da distribuição esparsa de sensores terrestres.

Sofiane Bouaziz, Adel Hafiane, Raphael Canals + 1 more2026-03-06🤖 cs.AI

The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology

Este estudo demonstra que a modificação intencional da topologia arquitetural de Transformers, especificamente ao impor uma topologia esférica limitada e substituir o roteamento de atenção dependente de dados por uma distribuição uniforme, elimina a fase de memorização e acelera drasticamente o fenômeno de "grokking" em tarefas de adição modular, evidenciando que alinhar os vieses geométricos da arquitetura com as simetrias intrínsecas da tarefa é crucial para a generalização imediata.

Alper Yıldırım2026-03-06🤖 cs.AI

Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making

Este estudo investiga como o fluxo de decisão, as explicações e a experiência do usuário influenciam a confiança e a dependência comportamental em sistemas de IA, revelando que a confiança declarada e o comportamento de reliance são construtos distintos e que o fluxo de decisão de dois passos não reduz necessariamente a superconfiança.

Laura Spillner, Rachel Ringe, Robert Porzel + 1 more2026-03-06🤖 cs.AI

Reclaiming Lost Text Layers for Source-Free Cross-Domain Few-Shot Learning

Este artigo propõe um método inovador para o Aprendizado de Poucos Exemplos Fonte-Livre entre Domínios (SF-CDFSL) que, ao invés de simplesmente remover as camadas intermediárias "perdidas" do codificador de texto do CLIP, ensina o modelo a reutilizar e integrar efetivamente essas informações para superar lacunas visuais e melhorar o desempenho em tarefas de adaptação de domínio.

Zhenyu Zhang, Guangyao Chen, Yixiong Zou + 2 more2026-03-06🤖 cs.AI

Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts

Este artigo apresenta o Whisperer, um framework de prompting visual que utiliza um pré-processador baseado em difusão e um currículo de clonagem comportamental para melhorar significativamente a precisão de modelos OCR congelados ao aprender a transformar pixel a pixel imagens degradadas, reduzindo a taxa de erro de caracteres em 8% sem ajustar os pesos do modelo original.

Samandar Samandarov, Nazirjon Ismoiljonov, Abdullah Sattorov + 1 more2026-03-06🤖 cs.AI

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

O artigo apresenta o WavSLM, um modelo de linguagem de fala de fluxo único que, ao quantizar e destilar representações do WavLM em um único código e otimizar a previsão autoregressiva de próximos blocos, consegue modelar conjuntamente informações semânticas e acústicas sem supervisão textual, alcançando desempenho competitivo com menos parâmetros e dados.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

O artigo apresenta o Med-V1, uma família de modelos de linguagem pequenos e eficientes que, apesar de terem apenas três bilhões de parâmetros, superam seus modelos base e competem com modelos de ponta como o GPT-5 na atribuição de evidências biomédicas e na detecção de alucinações, oferecendo uma alternativa escalável e de baixo custo para aplicações práticas.

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

Este artigo apresenta o PersianPunc, um grande conjunto de dados de 17 milhões de amostras para restauração de pontuação em persa, e demonstra que uma abordagem baseada no modelo ParsBERT supera modelos de linguagem grandes em precisão e eficiência, evitando edições indesejadas em pipelines de reconhecimento de fala.

Mohammad Javad Ranjbar Kalahroodi, Heshaam Faili, Azadeh Shakery2026-03-06🤖 cs.AI

GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering

O artigo apresenta o GALACTIC, o primeiro framework unificado que gera explicações contrafactuais locais e globais para agrupamento de séries temporais não supervisionado, utilizando otimização sensível a clusters e um algoritmo guloso baseado em MDL para produzir perturbações esparsas e resumos interpretáveis das transições entre clusters.

Christos Fragkathoulas, Eleni Psaroudaki, Themis Palpanas + 1 more2026-03-06🤖 cs.AI