VIVECaption: A Split Approach to Caption Quality Improvement

O relatório técnico VIVECaption apresenta uma abordagem sistemática de dois lados para melhorar a qualidade das legendas em modelos generativos, combinando a criação de um conjunto de dados de referência com estratégias de alinhamento de modelo, a fim de superar as limitações dos modelos de linguagem visual e fornecer dados de treinamento de alta qualidade e livres de direitos autorais.

Varun Ananth, Baqiao Liu, Haoran Cai2026-03-10💻 cs

Prompt-Based Caption Generation for Single-Tooth Dental Images Using Vision-Language Models

Este artigo propõe preencher a lacuna de conjuntos de dados de imagens dentárias focadas em um único dente com legendas, demonstrando que o uso de prompts orientados em Modelos Visão-Linguagem (VLMs) permite a geração eficaz de legendas descritivas para essas imagens, facilitando a criação de modelos com conhecimento holístico sobre os dentes.

Anastasiia Sukhanova, Aiden Taylor, Julian Myers, Zichun Wang, Kartha Veerya Jammuladinne, Satya Sri Rajiteswari Nimmagadda, Aniruddha Maiti, Ananya Jana2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

O artigo apresenta o UnSCAR, um novo paradigma de restauração de imagens universal que utiliza uma arquitetura de mistura de especialistas com múltiplos ramos para superar as limitações de escalabilidade e esquecimento catastrófico, permitindo o aprendizado estável de mais de dezesseis degradações, adaptação robusta a domínios não vistos e controle do usuário sobre o processo de restauração.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Toward Real-Time Mirrors Intelligence: System-Level Latency and Computation Evaluation in Internet of Mirrors (IoM)

Este estudo apresenta a primeira avaliação física de um testbed da Internet de Espelhos (IoM), demonstrando que não existe uma estratégia de colocação computacional universalmente ideal, pois o equilíbrio entre latência, carga de recursos e sobrecarga de rede depende dinamicamente das condições da rede, proximidade dos nós e carga de usuários simultâneos.

Haneen Fatima, Muhammad Ali Imran, Ahmad Taha, Lina Mohjazi2026-03-10💻 cs

Reality Check for Tor Website Fingerprinting in the Open World

Este estudo reexamina os ataques de impressão digital de sites no Tor em um cenário de mundo aberto realista, demonstrando que tais ataques permanecem altamente eficazes mesmo diante de ruído de rede e tráfego não monitorado, além de revelar que classificadores independentes de tempo são mais robustos e que o mecanismo Conflux não impede totalmente a eficácia do ataque.

Mohammadhamed Shadbeh, Khashayar Khajavi, Tao Wang2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Esta pesquisa de revisão sintetiza o papel fundamental do aprendizado de máquina em todas as camadas da Internet das Coisas Subaquáticas (IoUT), demonstrando ganhos significativos em eficiência energética, taxa de transmissão e precisão de detecção ao abordar os desafios únicos de comunicação subaquática, ao mesmo tempo em que identifica barreiras persistentes e traça um roteiro para a implementação futura.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Unifying Sidewinding and Rolling: A Wave-Based Framework for Self-Righting in Elongated Limbless and Multi-Legged Robots

Este estudo investiga a relação entre morfologia e estratégias de auto-direção em robôs alongados, utilizando centípedes biológicos e um robô paramétrico para estabelecer princípios de acoplamento que guiam o projeto de sistemas capazes de se reorientar em terrenos incertos.

Hangjun Liu, Jiarui Geng, Jinxuan Ding, Gengzhi He, Xiyuan Wang, Melisa Arukgoda, Joe DiGennaro, George Ubertalli, Grigoriy Blekherman, Baxi Chong2026-03-10💻 cs

Regression Testing in Remote and Hybrid Software Teams: An Exploratory Study of Processes, Tools, and Practices

Este estudo qualitativo com vinte profissionais de software revela que, em ambientes remotos e híbridos, a execução do teste de regressão mantém-se estável em sua essência, mas depende crescentemente de documentação robusta, automação e integração de ferramentas para superar os desafios de coordenação e comunicação, transformando-se em uma prática socio-técnica moldada pela infraestrutura digital.

Juliane Pascoal, Cleytton Magalhaes, Ronnie de Souza Santos2026-03-10💻 cs

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Este artigo propõe uma nova abordagem computacional para o problema de roteamento dinâmico de veículos que integra confirmação imediata de solicitações antecipadas com otimização contínua, utilizando aprendizado por reforço para maximizar o número de passageiros atendidos, conforme validado em dados reais de uma agência de transporte dos EUA.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

Cable-driven Continuum Robotics: Proprioception via Proximal-integrated Force Sensing

Este artigo apresenta um novo método de propriocepção para robôs contínuos microscópicos acionados por cabos, que integra sensores de força proximais e princípios de design bioinspirado para superar as limitações na percepção de forças de contato tridimensionais e na estimativa de forma, permitindo uma adoção clínica mais segura e ampla.

Gang Zhang, Junyan Yan, Jibiao Chen, Shing Shin Cheng2026-03-10💻 cs

RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

O artigo apresenta o RPG-SAM, um framework de segmentação poliposa one-shot sem treinamento que supera as limitações de métodos existentes ao abordar a heterogeneidade regional e de resposta por meio de mineração de protótipos ponderados por confiabilidade e seleção adaptativa geométrica, resultando em uma melhoria de 5,56% no mIoU no conjunto de dados Kvasir.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

O artigo apresenta o DogWeave, um framework baseado em modelo que reconstrói cães 3D de alta fidelidade a partir de uma única imagem RGB, refinando a geometria por meio de otimização de campos normais aprimorados por difusão e gerando texturas consistentes via inpainting condicional para superar desafios como oclusão e detalhes de pelagem.

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs