A Boundary-Metric Evaluation Protocol for Whiteboard Stroke Segmentation Under Extreme Imbalance

Este artigo propõe um protocolo de avaliação que integra métricas de fronteira e análise de equidade entre subconjuntos de traços finos para demonstrar que, em cenários de desequilíbrio extremo na segmentação de lousas brancas, modelos aprendidos com funções de perda baseadas em sobreposição e resolução aumentada superam métodos clássicos ao oferecer maior confiabilidade nos casos mais difíceis, apesar de métricas de média favoráveis a estes últimos.

Nicholas Korcynski2026-03-03🤖 cs.LG

ConFoThinking: Consolidated Focused Attention Driven Thinking for Visual Question Answering

O artigo apresenta o ConFoThinking, um framework que aprimora a Resposta Visual a Perguntas (VQA) em Modelos de Linguagem Multimodais ao consolidar sinais de atenção dispersos em uma camada intermediária e utilizar dicas semânticas concisas para localizar e focar em regiões relevantes, superando as limitações de métodos anteriores baseados em ferramentas de ancoragem ou atenção fragmentada.

Zhaodong Wu, Haochen Xue, Qi Cao + 5 more2026-03-03💻 cs

Image-Based Classification of Olive Species Specific to Turkiye with Deep Neural Networks

Este estudo demonstra que o uso de redes neurais convolucionais, especificamente o modelo EfficientNetB0 com aprendizado por transferência, permite classificar com alta precisão (94,5%) cinco espécies locais de oliveira cultivadas na Turquia a partir de imagens capturadas por câmera estéreo, oferecendo uma solução eficaz para identificação automática e controle de qualidade na agricultura.

Irfan Atabas, Hatice Karatas2026-03-03💻 cs

Task-Driven Subspace Decomposition for Knowledge Sharing and Isolation in LoRA-based Continual Learning

O artigo propõe o LoDA, um método de Aprendizado Contínuo baseado em LoRA que utiliza decomposição de subespaço orientada por tarefas e otimização alinhada a gradientes para separar eficazmente direções de compartilhamento e isolamento de conhecimento, superando as limitações de métodos anteriores ao capturar tanto direções compartilhadas quanto específicas de forma robusta.

Lingfeng He, De Cheng, Huaijie Wang + 3 more2026-03-03🤖 cs.LG

Optimisation of SOUP-GAN and CSR-GAN for High Resolution MR Images Reconstruction

Esta pesquisa otimiza os modelos SOUP-GAN e CSR-GAN através de modificações arquitetônicas e ajustes de hiperparâmetros para aprimorar a reconstrução de imagens de ressonância magnética de alta resolução, demonstrando que o CSR-GAN se destaca em detalhes de alta frequência e redução de ruído, enquanto o SOUP-GAN oferece imagens com menos ruído e melhor estrutura, ambos contribuindo para diagnósticos médicos mais precisos.

Muneeba Rashid, Hina Shakir, Humaira Mehwish + 2 more2026-03-03⚡ eess

VisRef: Visual Refocusing while Thinking Improves Test-Time Scaling in Multi-Modal Large Reasoning Models

O artigo apresenta o VisRef, um framework de escalonamento em tempo de teste que melhora o raciocínio em modelos multimodais ao re-injetar dinamicamente um conjunto representativo de tokens visuais semanticamente relevantes, superando abordagens anteriores sem a necessidade de ajuste fino baseado em aprendizado por reforço.

Soumya Suvra Ghosal, Youngeun Kim, Zhuowei Li + 6 more2026-03-03🤖 cs.AI

Pretty Good Measurement for Radiomics: A Quantum-Inspired Multi-Class Classifier for Lung Cancer Subtyping and Prostate Cancer Risk Stratification

Este artigo apresenta um classificador multi-classe inspirado na medição "Pretty Good" (PGM) da teoria quântica para radiômica, demonstrando sua eficácia competitiva e superioridade em tarefas de subtipagem de câncer de pulmão e estratificação de risco de câncer de próstata em comparação com métodos clássicos estabelecidos.

Giuseppe Sergioli, Carlo Cuccu, Giovanni Pasini + 4 more2026-03-03⚛️ quant-ph

Scaling Quantum Machine Learning without Tricks: High-Resolution and Diverse Image Generation

Este artigo apresenta um marco na geração de imagens quânticas ao demonstrar, sem truques de redução de dimensionalidade, que um único gerador quântico de GANs de Wasserstein, impulsionado por circuitos variacionais com viés indutivo e técnicas de ruído aprimoradas, consegue produzir imagens de alta resolução e diversas dos conjuntos de dados MNIST, Fashion-MNIST e Street View House Numbers, estabelecendo um novo estado da arte.

Jonas Jäger, Florian J. Kiwit, Carlos A. Riofrío2026-03-03⚛️ quant-ph

Ozone Cues Mitigate Reflected Downwelling Radiance in LWIR Absorption-Based Ranging

Este artigo apresenta dois novos métodos de alcance passivo no infravermelho de onda longa (LWIR) que utilizam características de absorção de ozônio para estimar e mitigar a radiação refletida, reduzindo drasticamente os erros de medição de mais de 100 metros para 6,8 metros (método quadspectral) e 1,2 metro (método hiperespectral).

Unay Dorken Gallastegi, Wentao Shangguan, Vaibhav Choudhary + 4 more2026-03-03⚡ eess