OmniCT: Towards a Unified Slice-Volume LVLM for Comprehensive CT Analysis

O artigo apresenta o OmniCT, um modelo unificado de visão e linguagem para análise de tomografia computadorizada que integra características de fatias e volumes para superar as limitações existentes na consistência espacial e granularidade, oferecendo desempenho superior em tarefas clínicas e estabelecendo um novo paradigma para a compreensão de imagens médicas.

Tianwei Lin, Zhongwei Qiu, Wenqiao Zhang + 12 more2026-03-03🤖 cs.AI

Prefer-DAS: Learning from Local Preferences and Sparse Prompts for Domain Adaptive Segmentation of Electron Microscopy

O artigo apresenta o Prefer-DAS, um modelo inovador de segmentação adaptativa de domínio para microscopia eletrônica que supera as limitações das estratégias não supervisionadas ao integrar prompts esparsos e otimização de preferência local, alcançando desempenho superior ou comparável a modelos supervisionados com mínima anotação humana.

Jiabao Chen, Shan Xiong, Jialin Peng2026-03-03💻 cs

Leveraging Causal Reasoning Method for Explaining Medical Image Segmentation Models

Este artigo apresenta um modelo explicativo para segmentação de imagens médicas baseado em raciocínio causal, que utiliza o efeito médio do tratamento (ATE) para quantificar a influência de regiões de entrada e componentes da rede, demonstrando maior fidelidade nas explicações e revelando heterogeneidade nas estratégias perceptivas de diferentes modelos.

Limai Jiang, Ruitao Xie, Bokai Yang + 6 more2026-03-03💻 cs

VII: Visual Instruction Injection for Jailbreaking Image-to-Video Generation Models

Este trabalho propõe o Visual Instruction Injection (VII), um framework de jailbreak sem treinamento e transferível que explora a capacidade de seguir instruções visuais em modelos de geração de imagem para vídeo, disfarçando intenções maliciosas de prompts de texto inseguros como instruções visuais benignas em imagens de referência para induzir a geração de conteúdo nocivo com alta taxa de sucesso.

Bowen Zheng, Yongli Xiang, Ziming Hong + 4 more2026-03-03💻 cs

Joint Shadow Generation and Relighting via Light-Geometry Interaction Maps

Os autores propõem os mapas de Interação Luz-Geometria (LGI), uma nova representação que codifica a oclusão sensível à luz a partir de mapas de profundidade monoculares, permitindo um pipeline unificado para geração conjunta de sombras e realimentação de iluminação que supera as limitações de métodos anteriores ao garantir consistência física e realismo em imagens sintéticas e reais.

Shan Wang, Peixia Li, Chenchen Xu + 4 more2026-03-03💻 cs

PhotoAgent: Agentic Photo Editing with Exploratory Visual Aesthetic Planning

O artigo apresenta o PhotoAgent, um sistema autônomo de edição fotográfica que utiliza planejamento estético explícito e busca em árvore para decompor tarefas complexas e refinar resultados iterativamente, validado por um novo benchmark chamado UGC-Edit que demonstra superioridade em aderência a instruções e qualidade visual em comparação com métodos existentes.

Mingde Yao, Zhiyuan You, King-Man Tam + 2 more2026-03-03💻 cs

HELMLAB: An Analytical, Data-Driven Color Space for Perceptual Distance in UI Design Systems

O artigo apresenta o HELMLAB, um espaço de cor analítico e orientado por dados com 72 parâmetros projetado para sistemas de design de interface, que supera o CIEDE2000 na precisão da distância perceptual ao incorporar correções de Fourier, ajustes Helmholtz-Kohlrausch e neutralidade garantida, oferecendo também utilitários para mapeamento de gamut e adaptação a temas claros e escuros.

Gorkem Yildiz2026-03-03💻 cs

Learning Under Extreme Data Scarcity: Subject-Level Evaluation of Lightweight CNNs for fMRI-Based Prodromal Parkinsons Detection

Este estudo demonstra que, na detecção de Parkinson prodromal baseada em fMRI com extrema escassez de dados, a avaliação rigorosa ao nível de sujeito revela que redes neurais convolucionais leves, como o MobileNet, generalizam melhor do que arquiteturas profundas, evitando o vazamento de informações e a superestimação de desempenho comuns em divisões ao nível de imagem.

Naimur Rahman2026-03-03🤖 cs.LG

Certainty-Validity: A Diagnostic Framework for Discrete Commitment Systems

Este artigo apresenta o Framework Certainty-Validity (CVS), uma nova métrica diagnóstica para sistemas de compromisso discreto que identifica e combate a falha de "confiança incorreta" (hallucinação) ao priorizar a distinção entre certeza e validade, demonstrando que a recusa do modelo em comprometer-se com dados ambíguos é uma característica desejável que deve ser preservada para evitar o sobreajuste benigno.

Datorien L. Anderson2026-03-03🤖 cs.LG

VoxelDiffusionCut: Non-destructive Internal-part Extraction via Iterative Cutting and Structure Estimation

O artigo apresenta o VoxelDiffusionCut, um método que utiliza um modelo de difusão para estimar iterativamente a estrutura interna de objetos a partir de superfícies de corte observadas e planejar cortes não destrutivos para a extração segura de componentes-alvo, superando as limitações de incerteza e colapso de modos de modelos generativos convencionais.

Takumi Hachimine, Yuhwan Kwon, Cheng-Yu Kuo + 2 more2026-03-03💻 cs