RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

O artigo apresenta o RPG-SAM, um framework de segmentação poliposa one-shot sem treinamento que supera as limitações de métodos existentes ao abordar a heterogeneidade regional e de resposta por meio de mineração de protótipos ponderados por confiabilidade e seleção adaptativa geométrica, resultando em uma melhoria de 5,56% no mIoU no conjunto de dados Kvasir.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

O artigo apresenta o DogWeave, um framework baseado em modelo que reconstrói cães 3D de alta fidelidade a partir de uma única imagem RGB, refinando a geometria por meio de otimização de campos normais aprimorados por difusão e gerando texturas consistentes via inpainting condicional para superar desafios como oclusão e detalhes de pelagem.

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs

Med-Evo: Test-time Self-evolution for Medical Multimodal Large Language Models

O artigo apresenta o Med-Evo, um framework pioneiro de auto-evolução para Modelos de Linguagem Multimodal Médica que utiliza aprendizado por reforço sem rótulos, combinando rotulagem pseudo baseada em características e recompensas híbridas, para melhorar o desempenho do modelo em dados de teste não rotulados sem depender de anotações adicionais.

Dunyuan Xu, Xikai Yang, Juzheng Miao, Yaoqian Li, Jinpeng Li, Pheng-Ann Heng2026-03-10💻 cs

Backdoor4Good: Benchmarking Beneficial Uses of Backdoors in LLMs

O artigo apresenta o Backdoor4Good (B4G), um novo benchmark e framework que reinterpreta os mecanismos de backdoor em modelos de linguagem grandes como interfaces controláveis e auditáveis para promover tarefas benéficas, como segurança e responsabilidade, demonstrando que esses mecanismos podem ser projetados de forma modular e segura para fortalecer a confiança em sistemas de IA.

Yige Li, Wei Zhao, Zhe Li, Nay Myat Min, Hanxun Huang, Yunhan Zhao, Xingjun Ma, Yu-Gang Jiang, Jun Sun2026-03-10💻 cs

Agentic AI-Driven UAV Network Deployment: A LLM-Enhanced Exact Potential Game Approach

Este artigo propõe um framework de otimização de topologia para redes de UAVs baseado em jogos de potencial exato e aprimorado por IA Agente e Grandes Modelos de Linguagem, que coordena decisões de enlace e implantação em múltiplas escalas espaciais para superar desafios de complexidade e melhorar o desempenho da rede.

Xin Tang, Qian Chen, Binhan Liao, Yaqi Zhang, Jianxin Chen, Changyuan Zhao, Junchuan Fan, Junxi Tian, Xiaohuan Li2026-03-10💻 cs

"Better Ask for Forgiveness than Permission": Practices and Policies of AI Disclosure in Freelance Work

Este estudo revela que, no trabalho freelancer, existe uma lacuna de expectativas sobre a divulgação do uso de IA, onde os trabalhadores tendem a ser passivos ao presumir que os clientes conseguem detectar a assistência, enquanto os clientes preferem a divulgação proativa devido à sua própria incerteza, destacando a necessidade de políticas e diretrizes mais claras para fomentar a confiança.

Angel Hsing-Chi Hwang, Senya Wong, Baixiao Chen, Jessica He, Hyo Jin Do2026-03-10💻 cs

Where Do LLM-based Systems Break? A System-Level Security Framework for Risk Assessment and Treatment

Este trabalho apresenta um framework de avaliação de riscos orientado a objetivos para sistemas baseados em Grandes Modelos de Linguagem (LLMs), que integra modelagem de sistemas com Árvores de Ataque-Defesa e pontuação CVSS para identificar pontos críticos e permitir a criação de defesas direcionadas em contextos de segurança crítica, como demonstrado em um estudo de caso na área da saúde.

Neha Nagaraja, Hayretdin Bahsi2026-03-10💻 cs

Do Machines Fail Like Humans? A Human-Centred Out-of-Distribution Spectrum for Mapping Error Alignment

Este artigo propõe um novo quadro de referência centrado no ser humano para analisar o alinhamento entre modelos de IA e a cognição humana, redefinindo a distribuição fora do padrão (OOD) como um espectro de dificuldade perceptual para revelar que a consistência do alinhamento varia significativamente dependendo da arquitetura do modelo e do nível de desafio perceptual.

Binxia Xu, Xiaoliang Luo, Luke Dickens, Robert M. Mok2026-03-10💻 cs

SIGMAE: A Spectral-Index-Guided Foundation Model for Multispectral Remote Sensing

O artigo apresenta o SIGMAE, um modelo fundamental para imagens multiespectrais que supera as limitações dos métodos MAE tradicionais ao utilizar índices espectrais como prioridade para guiar um mascaramento dinâmico de tokens focado em regiões semanticamente ricas, resultando em representações espaciais-espectrais superiores e melhor desempenho em diversas tarefas de sensoriamento remoto com poucos dados rotulados.

Xiaokang Zhang, Bo Li, Chufeng Zhou, Weikang Yu, Lefei Zhang2026-03-10💻 cs

Classifying Novel 3D-Printed Objects without Retraining: Towards Post-Production Automation in Additive Manufacturing

Este artigo apresenta o conjunto de dados ThingiPrint e um método de classificação baseado em protótipos que utiliza modelos CAD para identificar objetos 3D impressos sem necessidade de retreinamento, viabilizando a automação pós-produção na manufatura aditiva.

Fanis Mathioulakis, Gorjan Radevski, Silke GC Cleuren, Michel Janssens, Brecht Das, Koen Schauwaert, Tinne Tuytelaars2026-03-10💻 cs

FedEU: Evidential Uncertainty-Driven Federated Fine-Tuning of Vision Foundation Models for Remote Sensing Image Segmentation

O artigo apresenta o FedEU, um framework de otimização federada que utiliza modelagem de incerteza evidencial e incorporações de características específicas do cliente para aprimorar o ajuste fino de modelos fundamentais de visão em imagens de sensoriamento remoto, garantindo agregação global adaptativa e resultados mais robustos em ambientes heterogêneos.

Xiaokang Zhang, Xuran Xiong, Jianzhong Huang, Lefei Zhang2026-03-10💻 cs

Give Them an Inch and They Will Take a Mile:Understanding and Measuring Caller Identity Confusion in MCP-Based AI Systems

Este artigo revela que a falta de autenticação da identidade do chamador em sistemas baseados no Protocolo de Contexto de Modelo (MCP) cria vulnerabilidades críticas de segurança, permitindo que servidores confiem implicitamente em múltiplos chamadores após uma única autorização e expondo operações sensíveis a acessos não autorizados.

Yuhang Huang, Boyang Ma, Biwei Yan, Xuelong Dai, Yechao Zhang, Minghui Xu, Kaidi Xu, Yue Zhang2026-03-10💻 cs

EVLF: Early Vision-Language Fusion for Generative Dataset Distillation

O artigo apresenta o EVLF (Fusão Precoce Visão-Linguagem), um método plug-and-play para distilação de conjuntos de dados baseado em difusão que alinha embeddings textuais e visuais no início do processo de geração, superando a dominância de prompts textuais para produzir dados sintéticos mais fiéis e melhorar a precisão em tarefas de classificação.

Wenqi Cai, Yawen Zou, Guang Li, Chunzhi Gu, Chao Zhang2026-03-10💻 cs