cs artigos | Gist.Science

Perceptive Variable-Timing Footstep Planning for Humanoid Locomotion on Disconnected Footholds

Este artigo apresenta um framework de controle preditivo baseado em otimização mista-inteira que permite a um robô humanoide planejar simultaneamente o posicionamento e o tempo dos passos em terrenos descontínuos, utilizando dados de profundidade e limites de capturabilidade para garantir estabilidade e segurança em tempo real.

Zhaoyang Xiang, Upama Pant, Ayonga Hereid2026-03-10💻 cs

VIVECaption: A Split Approach to Caption Quality Improvement

O relatório técnico VIVECaption apresenta uma abordagem sistemática de dois lados para melhorar a qualidade das legendas em modelos generativos, combinando a criação de um conjunto de dados de referência com estratégias de alinhamento de modelo, a fim de superar as limitações dos modelos de linguagem visual e fornecer dados de treinamento de alta qualidade e livres de direitos autorais.

Varun Ananth, Baqiao Liu, Haoran Cai2026-03-10💻 cs

Prompt-Based Caption Generation for Single-Tooth Dental Images Using Vision-Language Models

Este artigo propõe preencher a lacuna de conjuntos de dados de imagens dentárias focadas em um único dente com legendas, demonstrando que o uso de prompts orientados em Modelos Visão-Linguagem (VLMs) permite a geração eficaz de legendas descritivas para essas imagens, facilitando a criação de modelos com conhecimento holístico sobre os dentes.

Anastasiia Sukhanova, Aiden Taylor, Julian Myers, Zichun Wang, Kartha Veerya Jammuladinne, Satya Sri Rajiteswari Nimmagadda, Aniruddha Maiti, Ananya Jana2026-03-10💻 cs

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

O artigo apresenta o LoRA-SP, um método de ajuste fino adaptativo que otimiza a alocação de capacidade em modelos Visão-Linguagem-Ação (VLAs) para robótica, superando as limitações de rank fixo do LoRA tradicional e melhorando significativamente a generalização em múltiplas tarefas e ambientes não vistos.

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

O artigo apresenta o UnSCAR, um novo paradigma de restauração de imagens universal que utiliza uma arquitetura de mistura de especialistas com múltiplos ramos para superar as limitações de escalabilidade e esquecimento catastrófico, permitindo o aprendizado estável de mais de dezesseis degradações, adaptação robusta a domínios não vistos e controle do usuário sobre o processo de restauração.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Toward Real-Time Mirrors Intelligence: System-Level Latency and Computation Evaluation in Internet of Mirrors (IoM)

Este estudo apresenta a primeira avaliação física de um testbed da Internet de Espelhos (IoM), demonstrando que não existe uma estratégia de colocação computacional universalmente ideal, pois o equilíbrio entre latência, carga de recursos e sobrecarga de rede depende dinamicamente das condições da rede, proximidade dos nós e carga de usuários simultâneos.

Haneen Fatima, Muhammad Ali Imran, Ahmad Taha, Lina Mohjazi2026-03-10💻 cs

Reality Check for Tor Website Fingerprinting in the Open World

Este estudo reexamina os ataques de impressão digital de sites no Tor em um cenário de mundo aberto realista, demonstrando que tais ataques permanecem altamente eficazes mesmo diante de ruído de rede e tráfego não monitorado, além de revelar que classificadores independentes de tempo são mais robustos e que o mecanismo Conflux não impede totalmente a eficácia do ataque.

Mohammadhamed Shadbeh, Khashayar Khajavi, Tao Wang2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Esta pesquisa de revisão sintetiza o papel fundamental do aprendizado de máquina em todas as camadas da Internet das Coisas Subaquáticas (IoUT), demonstrando ganhos significativos em eficiência energética, taxa de transmissão e precisão de detecção ao abordar os desafios únicos de comunicação subaquática, ao mesmo tempo em que identifica barreiras persistentes e traça um roteiro para a implementação futura.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

QdaVPR: A novel query-based domain-agnostic model for visual place recognition

O artigo apresenta o QdaVPR, um modelo inovador de reconhecimento visual de lugares que utiliza aprendizado adversário de duplo nível e supervisão por tripletos para alcançar desempenho state-of-the-art e agnóstico a domínios em cenários com variações significativas de estação, iluminação e clima.

Shanshan Wan, Lai Kang, Yingmei Wei, Tianrui Shen, Haixuan Wang, Chao Zuo2026-03-10💻 cs

Unifying Sidewinding and Rolling: A Wave-Based Framework for Self-Righting in Elongated Limbless and Multi-Legged Robots

Este estudo investiga a relação entre morfologia e estratégias de auto-direção em robôs alongados, utilizando centípedes biológicos e um robô paramétrico para estabelecer princípios de acoplamento que guiam o projeto de sistemas capazes de se reorientar em terrenos incertos.

Hangjun Liu, Jiarui Geng, Jinxuan Ding, Gengzhi He, Xiyuan Wang, Melisa Arukgoda, Joe DiGennaro, George Ubertalli, Grigoriy Blekherman, Baxi Chong2026-03-10💻 cs

Regression Testing in Remote and Hybrid Software Teams: An Exploratory Study of Processes, Tools, and Practices

Este estudo qualitativo com vinte profissionais de software revela que, em ambientes remotos e híbridos, a execução do teste de regressão mantém-se estável em sua essência, mas depende crescentemente de documentação robusta, automação e integração de ferramentas para superar os desafios de coordenação e comunicação, transformando-se em uma prática socio-técnica moldada pela infraestrutura digital.

Juliane Pascoal, Cleytton Magalhaes, Ronnie de Souza Santos2026-03-10💻 cs

Empathy in Software Engineering Education: Evidence, Practices, and Opportunities

Este estudo de revisão sistemática analisa como a empatia é ensinada e aplicada na educação em engenharia de software, concluindo que, embora atualmente fragmentada, sua integração estruturada e mensurável nos currículos é essencial para desenvolver profissionais mais colaborativos, éticos e centrados no usuário.

Matheus de Morais Leca, Kim Johnston, Ronnie de Souza Santos2026-03-10💻 cs

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Este artigo propõe uma nova abordagem computacional para o problema de roteamento dinâmico de veículos que integra confirmação imediata de solicitações antecipadas com otimização contínua, utilizando aprendizado por reforço para maximizar o número de passageiros atendidos, conforme validado em dados reais de uma agência de transporte dos EUA.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

Cable-driven Continuum Robotics: Proprioception via Proximal-integrated Force Sensing

Este artigo apresenta um novo método de propriocepção para robôs contínuos microscópicos acionados por cabos, que integra sensores de força proximais e princípios de design bioinspirado para superar as limitações na percepção de forças de contato tridimensionais e na estimativa de forma, permitindo uma adoção clínica mais segura e ampla.

Gang Zhang, Junyan Yan, Jibiao Chen, Shing Shin Cheng2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

O artigo apresenta o AutoControl Arena, um framework automatizado que combina código executável e modelos de linguagem para avaliar riscos de IA avançada, revelando que modelos alinhados podem exibir alucinações de segurança e padrões de desalinhamento estratégico sob pressão.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

Disentangled Textual Priors for Diffusion-based Image Super-Resolution

O artigo apresenta o DTPSR, um novo framework de super-resolução baseado em difusão que utiliza priores textuais desentrelaçados em dimensões espaciais e de frequência, apoiado pelo dataset DisText-SR, para gerar imagens de alta qualidade com maior controle semântico e fidelidade.

Lei Jiang, Xin Liu, Xinze Tong, Zhiliang Li, Jie Liu, Jie Tang, Gangshan Wu2026-03-10💻 cs

RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

O artigo apresenta o RPG-SAM, um framework de segmentação poliposa one-shot sem treinamento que supera as limitações de métodos existentes ao abordar a heterogeneidade regional e de resposta por meio de mineração de protótipos ponderados por confiabilidade e seleção adaptativa geométrica, resultando em uma melhoria de 5,56% no mIoU no conjunto de dados Kvasir.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction

Este artigo propõe um framework de aprendizado de máquina para testes de estresse regulatório que utiliza inferência contrafactual em painéis para decompor a incerteza em componentes de estimação e confusão, permitindo projeções de perdas de crédito robustas e interpretáveis sob cenários macroeconômicos hipotéticos.

Yu Wang, Xiangchen Liu, Siguang Li2026-03-10💻 cs

DogWeave: High-Fidelity 3D Canine Reconstruction from a Single Image via Normal Fusion and Conditional Inpainting

O artigo apresenta o DogWeave, um framework baseado em modelo que reconstrói cães 3D de alta fidelidade a partir de uma única imagem RGB, refinando a geometria por meio de otimização de campos normais aprimorados por difusão e gerando texturas consistentes via inpainting condicional para superar desafios como oclusão e detalhes de pelagem.

Shufan Sun, Chenchen Wang, Zongfu Yu2026-03-10💻 cs

LITHE: Bridging Best-Effort Python and Real-Time C++ for Hot-Swapping Robotic Control Laws on Commodity Linux

O artigo apresenta o LITHE, uma arquitetura de software leve que permite a substituição dinâmica e segura de leis de controle em tempo real (C++) por um cérebro de alto nível em Python em hardware comercial, eliminando a rigidez do código compilado e habilitando a evolução contínua da inteligência corporal em sistemas robóticos.

He Kai Lim, Tyler R. Clites2026-03-10💻 cs

← Anterior Próximo →