ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments

O artigo apresenta o ROBUST-MIPS, um novo conjunto de dados que combina pose esquelética e segmentação de instâncias de instrumentos cirúrgicos laparoscópicos, demonstrando que a anotação de pose é uma abordagem eficiente e rica em informações para impulsionar o desenvolvimento de tecnologias de intervenção assistida por computador.

Zhe Han, Charlie Budd, Gongyu Zhang + 3 more2026-03-05💻 cs

QDFlow: A Python package for physics simulations of quantum dot devices

O QDFlow é um pacote de simulação física de código aberto para dispositivos de pontos quânticos que gera dados sintéticos realistas com rótulos verdadeiros, superando as limitações de coleta experimental e facilitando o desenvolvimento e a validação de modelos de aprendizado de máquina para calibração e operação desses dispositivos.

Donovan L. Buterakos, Sandesh S. Kalantre, Joshua Ziegler + 2 more2026-03-05⚛️ quant-ph

Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections

Este artigo propõe o bloco de Conexão de Salto Dinâmico (DSC), que supera as limitações das conexões convencionais em redes do tipo U para segmentação de imagens médicas ao integrar módulos de Treinamento em Tempo de Teste e de Kernel Multi-Escala Dinâmico para adaptação baseada no conteúdo e integração de contexto global, demonstrando eficácia plug-and-play em diversas arquiteturas.

Yue Cao, Quansong He, Kaishen Wang + 3 more2026-03-05💻 cs

Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play

O artigo apresenta o Vision-Zero, um framework inovador de auto-aprendizagem sem rótulos para Modelos de Linguagem e Visão (VLMs) que utiliza um sistema multiagente de "jogos estratégicos" gerados a partir de imagens arbitrárias e um algoritmo de otimização iterativa para alcançar melhorias sustentáveis de desempenho em diversas tarefas de raciocínio visual, superando métodos que dependem de anotação humana.

Qinsi Wang, Bo Liu, Tianyi Zhou + 6 more2026-03-05🤖 cs.AI

Factuality Matters: When Image Generation and Editing Meet Structured Visuals

Este artigo apresenta uma investigação sistemática sobre a geração e edição de visuais estruturados, introduzindo um conjunto de dados de grande escala, um modelo unificado treinado com raciocínio aprimorado e o benchmark StructBench para avaliar a precisão factual, demonstrando que as abordagens atuais ainda carecem de desempenho satisfatório nessa área.

Le Zhuo, Songhao Han, Yuandong Pu + 8 more2026-03-05💻 cs

A Geometry-Based View of Mahalanobis OOD Detection

Este artigo investiga a dependência da detecção de dados fora de distribuição (OOD) baseada em Mahalanobis em relação à geometria das representações de fundo, identificando a estrutura espectral e a dimensionalidade intrínseca como fatores críticos e propondo uma normalização radial escalada (2\ell_2) que ajusta os raios das características para melhorar o desempenho sem alterar suas direções.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG

Weakly Supervised Concept Learning with Class-Level Priors for Interpretable Medical Diagnosis

Este artigo propõe o Prior-guided Concept Predictor (PCP), um framework de aprendizado supervisionado fraco que utiliza priors de conceitos ao nível da classe para gerar previsões interpretáveis em diagnósticos médicos sem necessidade de anotações explícitas, superando significativamente modelos de linguagem zero-shot e alcançando desempenho competitivo em relação a modelos totalmente supervisionados.

Md Nahiduzzaman, Steven Korevaar, Alireza Bab-Hadiashar + 1 more2026-03-05💻 cs

Re-coding for Uncertainties: Edge-awareness Semantic Concordance for Resilient Event-RGB Segmentation

Este artigo propõe o framework "Edge-awareness Semantic Concordance" (ESC), que utiliza dicas de bordas latentes e indicadores de incerteza para fundir de forma resiliente os dados heterogêneos de eventos e RGB, superando as limitações das segmentações semânticas existentes em condições extremas como baixa iluminação e movimento intenso da câmera.

Nan Bao, Yifan Zhao, Lin Zhu + 1 more2026-03-05💻 cs