cs artigos | Gist.Science

VSL-Skin: Individually Addressable Phase-Change Voxel Skin for Variable-Stiffness and Virtual Joints Bridging Soft and Rigid Robots

Este artigo apresenta a VSL-Skin, um revestimento de pele robótica baseado em voxels de mudança de fase individualmente endereçáveis que permite o controle morfológico preciso, a modulação de rigidez em múltiplas direções, a criação de juntas virtuais programáveis e a autorreparação autônoma, superando as limitações de sistemas de rigidez variável existentes ao integrar as vantagens de robôs macios e rígidos.

Zihan Oliver Zeng, Jiajun An, Preston Luk, Upinder Kaur2026-03-10💻 cs

Configurable Runtime Orchestration for Dynamic Data Retrieval in Distributed Systems

Este artigo apresenta um framework de orquestração baseado em configuração que gera grafos de execução dinâmicos em tempo de solicitação para permitir a recuperação de dados de baixa latência e escalável em sistemas distribuídos, superando as limitações de workflows pré-definidos em plataformas tradicionais.

Abhiram Kandiraju2026-03-10💻 cs

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Este artigo propõe uma abordagem para a recuperação de formas baseada em imagens que utiliza codificadores pré-alinhados de imagem e nuvem de pontos, eliminando a necessidade de síntese de visualizações e permitindo recuperação zero-shot, enquanto introduz uma perda de contraste difícil multimodal que alcança desempenho state-of-the-art em múltiplos conjuntos de dados.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil Sinha2026-03-10💻 cs

Perception-Aware Multimodal Spatial Reasoning from Monocular Images

Este artigo propõe um framework de raciocínio multimodal consciente da percepção que aprimora a compreensão espacial em imagens monoculares para direção autônoma, representando objetos por meio de tokens visuais de referência em vez de caixas delimitadoras textuais e utilizando um dataset de Cadeia de Pensamento Multimodal, alcançando desempenho superior no benchmark SURDS.

Yanchun Cheng, Rundong Wang, Xulei Yang, Alok Prakash, Daniela Rus, Marcelo H Ang Jr, ShiJie Li2026-03-10💻 cs

ADAS-TO: A Large-Scale Multimodal Naturalistic Dataset and Empirical Characterization of Human Takeovers during ADAS Engagement

O artigo apresenta o ADAS-TO, o primeiro grande conjunto de dados naturalístico multimodal focado em transições de ADAS para controle manual, contendo mais de 15 mil eventos de retomada que permitem uma caracterização empírica detalhada, incluindo a identificação de casos críticos de segurança e evidências de que sinais visuais acionáveis podem anteceder em até 3 segundos as intervenções humanas.

Yuhang Wang, Yiyao Xu, Jingran Sun, Hao Zhou2026-03-10💻 cs

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Este trabalho apresenta um modelo de mundo probabilístico baseado em modelos fundacionais de visão que, ao gerar estimativas de incerteza em um espaço latente comprimido, supera técnicas estatísticas e outros métodos de aprendizado na detecção precisa de falhas em manipuladores bimanuais, utilizando um novo conjunto de dados de manutenção de data centers e exigindo apenas uma fração dos parâmetros treináveis.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

MipSLAM: Alias-Free Gaussian Splatting SLAM

O artigo apresenta o MipSLAM, um sistema de SLAM baseado em Gaussian Splatting 3D que utiliza algoritmos de anti-aliasing adaptativo e otimização de pose no domínio espectral para alcançar síntese de novas vistas de alta fidelidade e estimativa de pose robusta, superando as limitações de aliasing e deriva de trajetória existentes.

Yingzhao Li, Yan Li, Shixiong Tian, Yanjie Liu, Lijun Zhao, Gim Hee Lee2026-03-10💻 cs

AdaGen: Learning Adaptive Policy for Image Synthesis

O artigo apresenta o AdaGen, um framework geral e adaptável que utiliza aprendizado por reforço com recompensas adversariais para otimizar automaticamente o agendamento de parâmetros em processos de síntese de imagem iterativos, superando as limitações de regras manuais e melhorando significativamente a qualidade e a eficiência de diversos modelos generativos.

Zanlin Ni, Yulin Wang, Yeguo Hua, Renping Zhou, Jiayi Guo, Jun Song, Bo Zheng, Gao Huang2026-03-10💻 cs

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Este artigo propõe um framework evolutivo fechado e impulsionado por Grandes Modelos de Linguagem que reconstrói automaticamente todos os sete componentes do Adaptive Large Neighborhood Search (ALNS), superando consistentemente as abordagens clássicas em benchmarks de otimização logística e revelando novos padrões de design através da análise de código.

Shaohua Yu, Tianyu Chen, Linyan Liu2026-03-10💻 cs

TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models

O artigo apresenta o TrajPred, um framework que melhora o reconhecimento de interações entre instrumentos e tecidos em cirurgias robóticas ao codificar trajetórias instrumentais para capturar informações temporais e gerar embeddings visuais mais precisos, resultando em melhor desempenho e alinhamento semântico no benchmark CholecT50.

Jiajun Cheng, Xiaofan Yu, Subarna, Sainan Liu, Shan Lin2026-03-10💻 cs

Privacy-Preserving Patient Identity Management Framework for Secure Healthcare Access

Este artigo apresenta um framework de gerenciamento de identidade de pacientes centrado no usuário e voltado para a privacidade, que equilibra a confiabilidade operacional com fortes proteções de privacidade através de pseudônimos anônimos e um mecanismo de rastreabilidade condicional, sendo validado formalmente e demonstrado como viável em ambientes clínicos.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Two-Stage Path Following for Mobile Manipulators via Dimensionality-Reduced Graph Search and Numerical Optimization

Este artigo apresenta um quadro de planejamento de duas etapas para manipuladores móveis que combina busca em grafo reduzida dimensionalmente e otimização numérica para gerar trajetórias suaves e precisas, superando as limitações de espaços de configuração de alta dimensão e restrições cinemáticas.

Fuyu Guo, Yuting Mei, Yuyao Zhang, Qian Tang2026-03-10💻 cs

An Extended Consent-Based Access Control Framework: Pre-Commit Validation and Emergency Access

Este artigo propõe uma extensão do modelo de Controle de Acesso Baseado em Consentimento (CBAC) que substitui a resolução de conflitos em tempo de execução por uma validação prévia de consistência semântica, garantindo invariáveis de sistema e um mecanismo de acesso de emergência controlado por evidências fisiológicas, resultando em menor latência e maior precisão na proteção de dados de saúde.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

O artigo apresenta o Mozart, um framework de co-projeto algoritmo-hardware que otimiza o treinamento de modelos de linguagem de grande escala com arquitetura Mixture-of-Experts (MoE) em chips de wafer escalonados 3.5D, utilizando estratégias de alocação de especialistas e agendamento granular para superar desafios de comunicação e utilização de recursos.

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Este estudo analisa como estudantes de design integram a inteligência artificial generativa em seus projetos, revelando que, embora a ferramenta acelere fases iniciais como brainstorming e síntese, a colaboração eficaz depende fundamentalmente de competências humanas superiores — como agência, conhecimento de domínio, imaginação e bom gosto — para validar, refinar e selecionar soluções criativas.

Qian Huang, King Wang Poon2026-03-10💻 cs

OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation

O artigo apresenta o OV-DEIM, um detector de objetos em tempo real baseado em arquitetura DETR que alcança desempenho de ponta em detecção de vocabulário aberto através da integração do framework DEIMv2, uma estratégia de suplementação de consultas e uma técnica de aumento de dados chamada GridSynthetic para melhorar a discriminação semântica e a eficiência.

Leilei Wang, Longfei Liu, Xi Shen, Xuanlong Yu, Ying Tiffany He, Fei Richard Yu, Yingyi Chen2026-03-10💻 cs

Enhancing Web Agents with a Hierarchical Memory Tree

O artigo propõe a Hierarchical Memory Tree (HMT), uma estrutura de memória hierárquica que desacopla o planejamento lógico da execução de ações para superar as limitações de generalização de agentes web baseados em LLMs em ambientes não vistos, demonstrando desempenho superior em tarefas complexas e de longo prazo.

Yunteng Tan, Zhi Gao, Xinxiao Wu2026-03-10💻 cs

Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking

Este artigo apresenta o TFM, um novo método de ataque que explora a vulnerabilidade temporal dos modelos de texto-para-vídeo ao solicitar apenas quadros inicial e final, permitindo que o modelo gere autonomamente conteúdo nocivo nos quadros intermediários e contorne assim os filtros de segurança tradicionais.

Moyang Chen, Zonghao Ying, Wenzhuo Xu, Quancheng Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang2026-03-10💻 cs

Improved Leakage Abuse Attacks in Searchable Symmetric Encryption with eBPF Monitoring

Este trabalho demonstra que o monitoramento de nível de sistema utilizando eBPF pode revelar novos padrões de vazamento em Criptografia Simétrica pesquisável (SSE), permitindo ataques de abuso de vazamento mais eficazes e destacando a necessidade de considerar essas ameaças práticas no projeto de defesas.

Chinecherem Dimobi2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

O artigo propõe o framework SSP, que utiliza Equações Diferenciais Ordinárias Neurais e Funções de Barreira de Controle para garantir segurança formal em políticas cirúrgicas baseadas em aprendizado, impondo restrições comportamentais e espaciais com violações próximas de zero enquanto mantém altas taxas de sucesso em tarefas.

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs

← Anterior Próximo →