Time2General: Learning Spatiotemporal Invariant Representations for Domain-Generalization Video Semantic Segmentation

O artigo apresenta o Time2General, um framework para segmentação semântica de vídeo generalizada de domínio que utiliza um Decodificador de Memória Espaço-Temporal e uma nova perda de consistência temporal para eliminar o efeito de flicker e garantir previsões estáveis em diferentes condições de domínio e taxas de amostragem, alcançando alto desempenho e eficiência em benchmarks de direção.

Siyu Chen, Ting Han, Haoling Huang + 5 more2026-02-24💻 cs

Handling Supervision Scarcity in Chest X-ray Classification: Long-Tailed and Zero-Shot Learning

Este artigo apresenta soluções específicas para o desafio CXR-LT 2026, abordando a escassez de supervisão em radiografias de tórax através de uma estratégia de aprendizado multi-rótulo equilibrada para classes raras e uma abordagem de reconhecimento zero-shot para doenças não vistas, alcançando o primeiro lugar no ranking público.

Ha-Hieu Pham, Hai-Dang Nguyen, Thanh-Huy Nguyen + 4 more2026-02-24💻 cs

StructCore: Structure-Aware Image-Level Scoring for Training-Free Unsupervised Anomaly Detection

O artigo apresenta o StructCore, um método de detecção de anomalias não supervisionado e sem treinamento que supera o *pooling* máximo ao utilizar descritores estruturais de baixa dimensão e calibração de Mahalanobis para melhorar a pontuação de nível de imagem, alcançando desempenho superior em conjuntos de dados como MVTec AD e VisA.

Joongwon Chae, Lihui Luo, Yang Liu + 8 more2026-02-24💻 cs

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

O artigo apresenta o DesignAsCode, um novo framework que reimagina a geração de designs gráficos como uma tarefa de síntese programática em HTML/CSS, utilizando um pipeline de Planejamento-Implementação-Reflexão para superar as limitações de editabilidade e fidelidade visual das abordagens existentes, resultando em designs estruturalmente válidos, esteticamente superiores e facilmente editáveis.

Ziyuan Liu, Shizhao Sun, Danqing Huang + 5 more2026-02-24🤖 cs.AI

Suppression or Deletion: A Restoration-Based Representation-Level Analysis of Machine Unlearning

Este artigo propõe uma nova análise baseada em restauração para demonstrar que a maioria dos métodos de "aprendizado não aprendido" (machine unlearning) apenas suprime informações em vez de apagá-las verdadeiramente, preservando características semânticas nas representações intermediárias dos modelos, o que revela riscos significativos não detectados pelas métricas atuais baseadas apenas em saída.

Yurim Jang, Jaeung Lee, Dohyun Kim + 2 more2026-02-24💻 cs

Wide Open Gazes: Quantifying Visual Exploratory Behavior in Soccer with Pose Enhanced Positional Data

Este artigo apresenta um novo modelo contínuo e estocástico baseado em dados de pose que quantifica o comportamento exploratório visual dos jogadores de futebol, superando as limitações dos métodos tradicionais e demonstrando que métricas visuais agregadas preveem o sucesso em ações de drible, integrando-se perfeitamente aos frameworks analíticos existentes.

Joris Bekkers2026-02-24🤖 cs.LG

Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity

Este estudo avalia a capacidade de métricas generativas de prever o desempenho do YOLOv11 em cenários de detecção de objetos com dados sintéticos, descobrindo que, embora a augmentação sintética traga ganhos significativos em regimes complexos, a correlação entre métricas globais e desempenho final é fortemente dependente do contexto e frequentemente enfraquece após o controle estatístico do volume de augmentação.

Vasile Marian, Yong-Bin Kang, Alexander Buddery2026-02-24🤖 cs.LG