VSL-Skin: Individually Addressable Phase-Change Voxel Skin for Variable-Stiffness and Virtual Joints Bridging Soft and Rigid Robots

Este artigo apresenta a VSL-Skin, um revestimento de pele robótica baseado em voxels de mudança de fase individualmente endereçáveis que permite o controle morfológico preciso, a modulação de rigidez em múltiplas direções, a criação de juntas virtuais programáveis e a autorreparação autônoma, superando as limitações de sistemas de rigidez variável existentes ao integrar as vantagens de robôs macios e rígidos.

Zihan Oliver Zeng, Jiajun An, Preston Luk, Upinder Kaur2026-03-10💻 cs

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Este artigo propõe uma abordagem para a recuperação de formas baseada em imagens que utiliza codificadores pré-alinhados de imagem e nuvem de pontos, eliminando a necessidade de síntese de visualizações e permitindo recuperação zero-shot, enquanto introduz uma perda de contraste difícil multimodal que alcança desempenho state-of-the-art em múltiplos conjuntos de dados.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil Sinha2026-03-10💻 cs

Perception-Aware Multimodal Spatial Reasoning from Monocular Images

Este artigo propõe um framework de raciocínio multimodal consciente da percepção que aprimora a compreensão espacial em imagens monoculares para direção autônoma, representando objetos por meio de tokens visuais de referência em vez de caixas delimitadoras textuais e utilizando um dataset de Cadeia de Pensamento Multimodal, alcançando desempenho superior no benchmark SURDS.

Yanchun Cheng, Rundong Wang, Xulei Yang, Alok Prakash, Daniela Rus, Marcelo H Ang Jr, ShiJie Li2026-03-10💻 cs

ADAS-TO: A Large-Scale Multimodal Naturalistic Dataset and Empirical Characterization of Human Takeovers during ADAS Engagement

O artigo apresenta o ADAS-TO, o primeiro grande conjunto de dados naturalístico multimodal focado em transições de ADAS para controle manual, contendo mais de 15 mil eventos de retomada que permitem uma caracterização empírica detalhada, incluindo a identificação de casos críticos de segurança e evidências de que sinais visuais acionáveis podem anteceder em até 3 segundos as intervenções humanas.

Yuhang Wang, Yiyao Xu, Jingran Sun, Hao Zhou2026-03-10💻 cs

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Este trabalho apresenta um modelo de mundo probabilístico baseado em modelos fundacionais de visão que, ao gerar estimativas de incerteza em um espaço latente comprimido, supera técnicas estatísticas e outros métodos de aprendizado na detecção precisa de falhas em manipuladores bimanuais, utilizando um novo conjunto de dados de manutenção de data centers e exigindo apenas uma fração dos parâmetros treináveis.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

AdaGen: Learning Adaptive Policy for Image Synthesis

O artigo apresenta o AdaGen, um framework geral e adaptável que utiliza aprendizado por reforço com recompensas adversariais para otimizar automaticamente o agendamento de parâmetros em processos de síntese de imagem iterativos, superando as limitações de regras manuais e melhorando significativamente a qualidade e a eficiência de diversos modelos generativos.

Zanlin Ni, Yulin Wang, Yeguo Hua, Renping Zhou, Jiayi Guo, Jun Song, Bo Zheng, Gao Huang2026-03-10💻 cs

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Este artigo propõe um framework evolutivo fechado e impulsionado por Grandes Modelos de Linguagem que reconstrói automaticamente todos os sete componentes do Adaptive Large Neighborhood Search (ALNS), superando consistentemente as abordagens clássicas em benchmarks de otimização logística e revelando novos padrões de design através da análise de código.

Shaohua Yu, Tianyu Chen, Linyan Liu2026-03-10💻 cs

TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models

O artigo apresenta o TrajPred, um framework que melhora o reconhecimento de interações entre instrumentos e tecidos em cirurgias robóticas ao codificar trajetórias instrumentais para capturar informações temporais e gerar embeddings visuais mais precisos, resultando em melhor desempenho e alinhamento semântico no benchmark CholecT50.

Jiajun Cheng, Xiaofan Yu, Subarna, Sainan Liu, Shan Lin2026-03-10💻 cs

Privacy-Preserving Patient Identity Management Framework for Secure Healthcare Access

Este artigo apresenta um framework de gerenciamento de identidade de pacientes centrado no usuário e voltado para a privacidade, que equilibra a confiabilidade operacional com fortes proteções de privacidade através de pseudônimos anônimos e um mecanismo de rastreabilidade condicional, sendo validado formalmente e demonstrado como viável em ambientes clínicos.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

An Extended Consent-Based Access Control Framework: Pre-Commit Validation and Emergency Access

Este artigo propõe uma extensão do modelo de Controle de Acesso Baseado em Consentimento (CBAC) que substitui a resolução de conflitos em tempo de execução por uma validação prévia de consistência semântica, garantindo invariáveis de sistema e um mecanismo de acesso de emergência controlado por evidências fisiológicas, resultando em menor latência e maior precisão na proteção de dados de saúde.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

O artigo apresenta o Mozart, um framework de co-projeto algoritmo-hardware que otimiza o treinamento de modelos de linguagem de grande escala com arquitetura Mixture-of-Experts (MoE) em chips de wafer escalonados 3.5D, utilizando estratégias de alocação de especialistas e agendamento granular para superar desafios de comunicação e utilização de recursos.

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang Poon2026-03-10💻 cs

OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation

O artigo apresenta o OV-DEIM, um detector de objetos em tempo real baseado em arquitetura DETR que alcança desempenho de ponta em detecção de vocabulário aberto através da integração do framework DEIMv2, uma estratégia de suplementação de consultas e uma técnica de aumento de dados chamada GridSynthetic para melhorar a discriminação semântica e a eficiência.

Leilei Wang, Longfei Liu, Xi Shen, Xuanlong Yu, Ying Tiffany He, Fei Richard Yu, Yingyi Chen2026-03-10💻 cs

Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking

Este artigo apresenta o TFM, um novo método de ataque que explora a vulnerabilidade temporal dos modelos de texto-para-vídeo ao solicitar apenas quadros inicial e final, permitindo que o modelo gere autonomamente conteúdo nocivo nos quadros intermediários e contorne assim os filtros de segurança tradicionais.

Moyang Chen, Zonghao Ying, Wenzhuo Xu, Quancheng Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

O artigo propõe o framework SSP, que utiliza Equações Diferenciais Ordinárias Neurais e Funções de Barreira de Controle para garantir segurança formal em políticas cirúrgicas baseadas em aprendizado, impondo restrições comportamentais e espaciais com violações próximas de zero enquanto mantém altas taxas de sucesso em tarefas.

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs