cs artigos | Gist.Science

GSAT: Geometric Traversability Estimation using Self-supervised Learning with Anomaly Detection for Diverse Terrains

O artigo apresenta o GSAT, um método de estimativa de transitabilidade para navegação autônoma que utiliza aprendizado auto-supervisionado e detecção de anomalias em um espaço latente para superar as limitações da subjetividade humana e do problema de aprendizado apenas com exemplos positivos.

Dongjin Cho, Miryeong Park, Juhui Lee, Geonmo Yang, Younggun Cho2026-03-10💻 cs

HSC-VLA: Hierarchical Scene-Clearing for Robust Bimanual Manipulation in Dense Clutter

O artigo apresenta o HSC-VLA, uma estrutura hierárquica que melhora significativamente a manipulação robótica bimanual em ambientes densamente clutterados ao separar o raciocínio semântico de alto nível da execução sensorimotora de baixo nível, utilizando mascaramento de cena para filtrar distrações visuais e alcançar uma taxa de sucesso de 86,7%.

Zhen Liu, Xinyu Ning, Zhe Hu, XinXin Xie, Yitong Liu, Zhongzhu Pu2026-03-10💻 cs

Multi-Modal Decouple and Recouple Network for Robust 3D Object Detection

Este artigo apresenta uma Rede de Desacoplamento e Recuperação Multimodal que melhora a detecção robusta de objetos 3D ao separar características invariantes e específicas de cada modalidade (LiDAR e câmera) para compensar falhas causadas por corrupção de dados, utilizando uma fusão adaptativa de especialistas que supera os modelos existentes tanto em dados limpos quanto corrompidos.

Rui Ding, Zhaonian Kuang, Yuzhe Ji, Meng Yang, Xinhu Zheng, Gang Hua2026-03-10💻 cs

RobustSCI: Beyond Reconstruction to Restoration for Snapshot Compressive Imaging under Real-World Degradations

O artigo apresenta o RobustSCI, o primeiro estudo focado na restauração de imagens comprimidas de vídeo (SCI) a partir de medições degradadas por desfoque de movimento e baixa luminosidade, utilizando um novo benchmark, uma arquitetura com blocos de atenção especializados e uma rede em cascata para superar as limitações dos métodos atuais de reconstrução.

Hao Wang, Yuanfan Li, Qi Zhou, Zhankuo Xu, Jiong Ni, Xin Yuan2026-03-10💻 cs

RayD3D: Distilling Depth Knowledge Along the Ray for Robust Multi-View 3D Object Detection

O artigo apresenta o RayD3D, um método inovador que melhora a robustez da detecção 3D multi-visão em cenários do mundo real ao transferir conhecimento de profundidade essencial ao longo de raios ópticos, evitando a propagação de informações irrelevantes do LiDAR e superando modelos existentes sem aumentar os custos de inferência.

Rui Ding, Zhaonian Kuang, Zongwei Zhou, Meng Yang, Xinhu Zheng, Gang Hua2026-03-10💻 cs

DocCogito: Aligning Layout Cognition and Step-Level Grounded Reasoning for Document Understanding

O artigo apresenta o DocCogito, um quadro unificado que alinha a cognição de layout com raciocínio fundamentado em nível de etapa para compreensão de documentos, utilizando um torre de layout leve e uma Cadeia Visual-Semântica (VSC) para supervisionar um raciocínio intermediário estruturado e alinhado com evidências regionais, alcançando resultados state-of-the-art em múltiplos benchmarks.

Yuchuan Wu, Minghan Zhuo, Teng Fu, Mengyang Zhao, Bin Li, Xiangyang Xue2026-03-10💻 cs

From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

O artigo propõe o framework de Evolução de Autonomia Hierárquica (HAE) para abordar as vulnerabilidades de segurança emergentes em agentes de IA, organizando a defesa em três níveis (cognitivo, de execução e coletivo) e apresentando uma taxonomia de ameaças para guiar o desenvolvimento de arquiteturas de proteção multicamadas.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

AMR-CCR: Anchored Modular Retrieval for Continual Chinese Character Recognition

O artigo apresenta o AMR-CCR, um framework de recuperação modular ancorada que resolve o reconhecimento contínuo de caracteres chineses antigos em cenários de crescimento incremental de classes e diversidade de estilos, introduzindo também o benchmark EvoCON para avaliação sistemática.

Yuchuan Wu, Yinglian Zhu, Haiyang Yu, Ke Niu, Bin Li, Xiangyang Xue2026-03-10💻 cs

Inverse-dynamics observer design for a linear single-track vehicle model with distributed tire dynamics

Este artigo propõe um observador inovador baseado em dinâmica inversa que combina um modelo linear de veículo de uma pista com uma representação distribuída dos pneus via equações diferenciais parciais hiperbólicas, permitindo a estimativa precisa do ângulo de derrapagem e das forças dos pneus apenas a partir de medições de taxa de guinada e aceleração lateral, mesmo na presença de ruído e incertezas do modelo.

Luigi Romano, Ole Morten Aamo, Jan Åslund, Erik Frisk2026-03-10💻 cs

SeDa: A Unified System for Dataset Discovery and Multi-Entity Augmented Semantic Exploration

O artigo apresenta o SeDa, um sistema unificado que integra mais de 7,6 milhões de conjuntos de dados de diversas fontes para facilitar sua descoberta e exploração semântica por meio de anotação padronizada, verificação de procedência e navegação contextual baseada em entidades.

Kan Ling, Zhen Qin, Yichi Zhu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-10💻 cs

High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion

Este trabalho propõe um framework de difusão latente baseado em esqueleto para geração de formas médicas de alta fidelidade, combinando um autoencoder com módulos de esquelentização e campos implícitos neurais, e apresenta o conjunto de dados de grande escala MedSDF para superar as limitações de dados disponíveis.

Guoqing Zhang, Jingyun Yang, Siqi Chen, Anping Zhang, Yang Li2026-03-10💻 cs

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Este estudo analisa a polarização política no subreddit r/Brexit do Reddit, revelando que a exposição a opiniões cruzadas é mínima e que a polarização é sustentada principalmente pela seleção de usuários já entranhados em suas posições e pela formação de câmaras de eco, em vez de ser atenuada por interações diversificadas.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine Largeron2026-03-10💻 cs

EvolveReason: Self-Evolving Reasoning Paradigm for Explainable Deepfake Facial Image Identification

O artigo apresenta o EvolveReason, um paradigma de raciocínio autoevolutivo que combina um conjunto de dados de cadeia de pensamento (CoT-Face), captura de distribuição no espaço latente de falsificações e uma estratégia de exploração por aprendizado por reforço para superar as limitações de alucinação e falta de detalhe dos métodos existentes, oferecendo identificação de deepfakes faciais com alto desempenho e explicações textuais confiáveis.

Binjia Zhou, Dawei Luo, Shuai Chen, Feng Xu, Seow, Haoyuan Li, Jiachi Wang, Jiawen Wang, Zunlei Feng, Yijun Bei2026-03-10💻 cs

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

O artigo apresenta o InterReal, um framework unificado de aprendizado por imitação baseado em física que permite a robôs humanoides aprender e executar com sucesso habilidades de interação humano-objeto no mundo real, superando limitações de frameworks anteriores através de uma nova estratégia de aumento de dados com restrições de contato e um aprendizado automático de recompensas.

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs

GP-Tree: An in-memory spatial index combining adaptive grid cells with a prefix tree for efficient spatial querying

O artigo apresenta o GP-Tree, um índice espacial em memória que combina células de grade adaptativas com uma árvore de prefixos para superar as limitações dos índices tradicionais baseados em retângulos delimitadores, oferecendo uma filtragem mais precisa e melhorando significativamente a eficiência de consultas espaciais em grandes conjuntos de dados.

Xiangyang Yang, Xuefeng Guan, Lanxue Dang, Yi Xie, Qingyang Xu, Huayi Wu, Jiayao Wang2026-03-10💻 cs

On the Effectiveness of Code Representation in Deep Learning-Based Automated Patch Correctness Assessment

Este estudo realiza a primeira avaliação extensiva da eficácia de diferentes representações de código na previsão da correção de patches, demonstrando que representações baseadas em grafos superam consistentemente outras abordagens e que a integração de representações sequenciais a heurísticas melhora significativamente a detecção de patches com sobreajuste.

Quanjun Zhang, Chunrong Fang, Haichuan Hu, Yuan Zhao, Weisong Sun, Yun Yang, Tao Zheng, Zhenyu Chen2026-03-10💻 cs

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

Este trabalho apresenta o SketchGraphNet, uma arquitetura híbrida de grafos que combina passagem de mensagens local com um mecanismo de atenção global eficiente em memória para reconhecimento de esboços em larga escala, alcançando alto desempenho no novo benchmark SketchGraph sem depender de codificações auxiliares.

Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao2026-03-10💻 cs

ICLR: In-Context Imitation Learning with Visual Reasoning

O artigo apresenta o ICLR, um novo framework de aprendizado por imitação em contexto que aprimora a adaptação robótica a tarefas complexas ao integrar traços de raciocínio visual estruturado e previsão de ações em um único modelo transformador autoregressivo, demonstrando melhorias significativas na taxa de sucesso e generalização em comparação com métodos existentes.

Toan Nguyen, Weiduo Yuan, Songlin Wei, Hui Li, Daniel Seita, Yue Wang2026-03-10💻 cs

MIRO: Multi-radar Identity and Ranging for Occupational Safety

O artigo apresenta o MIRO, um sistema de segurança ocupacional que combina sensores de partículas e radares mmWave com uma rede baseada em GAN para rastrear trabalhadores e estimar sua exposição a poluentes em ambientes industriais, garantindo privacidade e precisão sem o uso de câmeras.

Tirthankar Halder, Argha Sen, Swadhin Pradhan, Rijurekha Sen, Sandip Chakraborty2026-03-10💻 cs

ACCURATE: Arbitrary-shaped Continuum Reconstruction Under Robust Adaptive Two-view Estimation

O artigo apresenta o ACCURATE, um framework de reconstrução 3D robusto que combina redes neurais de segmentação com um algoritmo de otimização geométrica para reconstruir com alta precisão corpos contínuos longos e finos, como cateteres, a partir de imagens biplanares, superando as limitações de métodos existentes em relação a oclusões e formas complexas.

Yaozhi Zhang, Shun Yu, Yugang Zhang, Yang Liu2026-03-10💻 cs

← Anterior Próximo →