cs artigos | Gist.Science

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

O artigo apresenta o DeepEarth, um modelo de mundo auto-supervisionado multi-modal que utiliza o codificador posicional 4D Earth4D para escalar com precisão sub-métrica e sub-segundo em escala planetária, alcançando desempenho superior em previsões ecológicas.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

TacDexGrasp: Compliant and Robust Dexterous Grasping with Tactile Feedback

O artigo TacDexGrasp apresenta um controlador baseado em Programação Cônica de Segunda Ordem e feedback tátil que garante a estabilidade de preensões dexterosas em objetos desconhecidos, prevenindo tanto o deslizamento translacional quanto o rotacional ao restringir ativamente a razão entre as forças tangenciais e normais em cada contato, sem a necessidade de modelagem explícita de torque ou detecção de deslizamento.

Yubin Ke, Jiayi Chen, Hang Lv, Xiao Zhou, He Wang2026-03-10💻 cs

AIReSim: A Discrete Event Simulator for Large-scale AI Cluster Reliability Modeling

O artigo apresenta o AIReSim, um simulador de eventos discretos projetado para modelar a confiabilidade de clusters de IA em grande escala, permitindo aos engenheiros avaliar sistematicamente configurações, priorizar melhorias e realizar planejamento de capacidade através de cenários hipotéticos.

Karthik Pattabiraman, Mihir Patel, Fred Lin2026-03-10💻 cs

Fine-Grained 3D Facial Reconstruction for Micro-Expressions

Este artigo propõe um método inovador de reconstrução 3D de microexpressões faciais que integra características dinâmicas globais e locais enriquecidas para superar os desafios da natureza sutil e transitória dessas expressões, superando os métodos atuais em precisão geométrica e detalhe perceptual.

Che Sun, Xinjie Zhang, Rui Gao, Xu Chen, Yuwei Wu, Yunde Jia2026-03-10💻 cs

Understanding User Requirements for Creating Sensor-Powered Smart Car Cabins Through Retrofitting

Este artigo apresenta um estudo de duas fases que identifica os requisitos dos usuários e oferece recomendações de design para soluções de retrofitting que complementam e superam as limitações dos sensores de cabines inteligentes integrados pelos fabricantes de automóveis.

Bofan Yu, Borui Li, Tingyu Zhang, Xing-Dong Yang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

O artigo propõe o framework CAPL, que combina calibração de atenção inter-imagem e aprendizado por preferência para mitigar alucinações em modelos de linguagem e visão grandes, melhorando a modelagem de associações entre múltiplas imagens e a fundamentação em evidências visuais autênticas.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

Communication Network-Aware Missing Data Recovery for Enhanced Distribution Grid Visibility

Este artigo propõe um quadro de recuperação de dados que integra restrições de roteamento de rede de comunicação com completamento de matriz de baixo posto para melhorar a precisão na recuperação de medições faltantes em redes de distribuição, superando os métodos tradicionais que ignoram a dependência espacial causada por falhas na comunicação.

Biswas Rudra Jyoti Arka, Md Zahidul Islam, Yuzhang Lin, Vinod M. Vokkarane, Junbo Zhao2026-03-10💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

Este artigo apresenta uma ferramenta web baseada em Grandes Modelos de Linguagem (LLMs) que automatiza e escala a construção de bancos de dados científicos abertos, alcançando 90% de sobreposição com curadoria humana e reduzindo significativamente o trabalho manual na coleta e filtragem de literatura científica.

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico Gomez2026-03-10💻 cs

Animating Petascale Time-varying Data on Commodity Hardware with LLM-assisted Scripting

Este artigo apresenta um framework acessível que permite a cientistas sem especialização em visualização criar animações 3D de dados climáticos em escala petasséptica em estações de trabalho comuns, utilizando um sistema de descritores de animação, acesso eficiente a dados na nuvem e uma interface assistida por LLM para gerar resultados em tempo reduzido.

Ishrat Jahan Eliza, Xuan Huang, Aashish Panta, Alper Sahistan, Zhimin Li, Amy A. Gooch, Valerio Pascucci2026-03-10💻 cs

Bi-directional digital twin prototype anchoring with multi-periodicity learning for few-shot fault diagnosis

Este artigo propõe um protótipo de gêmeo digital bidirecional com ancoragem de protótipos e aprendizado de multi-periodicidade para realizar diagnóstico de falhas eficiente em cenários de poucos dados, superando as limitações dos métodos tradicionais que dependem de grandes volumes de dados rotulados.

Pengcheng Xia, Zhichao Dong, Yixiang Huang, Chengjin Qin, Qun Chao, Chengliang Liu2026-03-10💻 cs

SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer

O artigo propõe o SODA, um método de aceleração dinâmica orientado à sensibilidade que otimiza o cache e a poda em Transformers de Difusão com base em modelagem de erro de sensibilidade granular, alcançando fidelidade de geração superior em comparação com métodos existentes.

Tong Shao, Yusen Fu, Guoying Sun, Jingde Kong, Zhuotao Tian, Jingyong Su2026-03-10💻 cs

GuideTWSI: A Diverse Tactile Walking Surface Indicator Dataset from Synthetic and Real-World Images for Blind and Low-Vision Navigation

O artigo apresenta o GuideTWSI, um novo conjunto de dados diversificado de imagens sintéticas e reais que supera as limitações geográficas e de viewpoint dos datasets existentes ao incluir tanto barras direcionais quanto domos truncados, visando melhorar a detecção e navegação segura de pessoas cegas e com baixa visão.

Hochul Hwang, Soowan Yang, Anh N. H. Nguyen, Parth Goel, Krisha Adhikari, Sunghoon I. Lee, Joydeep Biswas, Nicholas A. Giudice, Donghyun Kim2026-03-10💻 cs

A Declarative Framework for Hand-Crafted Mutation Analysis and Management

O artigo apresenta um framework declarativo chamado Marauder que unifica a análise e gestão de mutações manuais através de cinco representações, uma álgebra de mutação e um pipeline de conversão sem perdas, visando superar as limitações atuais de ferramentas de teste ao equilibrar legibilidade, preservação de mutações e custo de execução.

Alperen Keles2026-03-10💻 cs

MedSteer: Counterfactual Endoscopic Synthesis via Training-Free Activation Steering

O artigo apresenta o MedSteer, um framework de direção de ativação sem treinamento para síntese endoscópica que gera pares contrafactuais preservando a estrutura anatômica ao identificar e manipular vetores de patologia nas camadas de atenção cruzada de modelos de difusão, superando métodos existentes na geração de dados causais e melhorando o desempenho na detecção de pólipos.

Trong-Thang Pham, Loc Nguyen, Anh Nguyen, Hien Nguyen, Ngan Le2026-03-10💻 cs

Geometry and design of popup structures

Este artigo explora a geometria das estruturas pop-up, combinando origami e kirigami para desenvolver um pipeline de projeto que permite criar superfícies com curvatura variável e transições de negativa para positiva, com aplicações em redução de arrasto, embalagens e fachadas arquitetônicas.

Jay Jayeshbhai Chavda, S Ganga Prasath2026-03-10✓ Author reviewed ⓘ💻 cs

Morphology-Independent Facial Expression Imitation for Human-Face Robots

Este artigo apresenta um método de imitação de expressões faciais independente da morfologia para robôs humanóides, que desacopla a semântica da expressão da estrutura facial para gerar movimentos mais realistas, validado experimentalmente no robô Pengrui.

Xu Chen, Rui Gao, Che Sun, Zhehang Liu, Yuwei Wu, Shuo Yang, Yunde Jia2026-03-10💻 cs

User Review Writing via Interview with Dialogue Systems

Este estudo propõe e valida um sistema de diálogo baseado em GPT-4 que facilita a criação de avaliações de usuários por meio de entrevistas, demonstrando que as avaliações geradas exigem menos edição e são consideradas mais úteis por leitores do que as escritas manualmente, apesar de desafios de fluência.

Yoshiki Tanaka, Michimasa Inaba2026-03-10💻 cs

VirtueBench: Evaluating Trustworthiness under Uncertainty in Long Video Understanding

O artigo apresenta o VirtueBench, um novo benchmark projetado para avaliar a confiabilidade de Modelos Visão-Linguagem em vídeos longos ao distinguir entre casos respondíveis e não respondíveis, revelando que a maioria dos modelos atuais tende a adivinhar em vez de recusar respostas honestamente sob incerteza.

Xueqing Yu, Bohan Li, Yan Li, Zhenheng Yang2026-03-10💻 cs

Physics-Guided VLM Priors for All-Cloud Removal

O artigo apresenta o PhyVLM-CR, uma abordagem inovadora que integra as capacidades semânticas de um Modelo Visão-Linguagem (VLM) a um modelo de restauração física para realizar a remoção unificada e de alta fidelidade de nuvens finas e espessas em imagens de sensoriamento remoto, eliminando a necessidade de decisões explícitas sobre o tipo de nuvem e garantindo resultados coerentes e livres de alucinações.

Liying Xu, Huifang Li, Huanfeng Shen2026-03-10💻 cs

Retinex Meets Language: A Physics-Semantics-Guided Underwater Image Enhancement Network

Este artigo apresenta o PSG-UIENet, uma rede de aprimoramento de imagens subaquáticas que integra correção de iluminação baseada em Retinex com orientações semânticas de linguagem, acompanhada pela criação do primeiro conjunto de dados multimodais (LUIQD-TD) e de uma função de perda específica para garantir consistência semântica entre texto e imagem.

Shixuan Xu, Yabo Liu, Junyu Dong, Xinghui Dong2026-03-10💻 cs

← Anterior Próximo →