cs artigos | Gist.Science

Fast Attention-Based Simplification of LiDAR Point Clouds for Object Detection and Classification

Este artigo propõe um método de simplificação de nuvens de pontos LiDAR baseado em atenção e aprendizado, que supera o compromisso tradicional entre velocidade e precisão ao priorizar regiões relevantes para tarefas, mantendo ou melhorando a acurácia em detecção e classificação de objetos enquanto é mais rápido que o método de amostragem por pontos mais distantes (FPS).

Z. Rozsa, Á. Madaras, Q. Wei, X. Lu, M. Golarits, H. Yuan, T. Sziranyi, R. Hamzaoui2026-03-10💻 cs

VB-NET: A physics-constrained gray-box deep learning framework for modeling air conditioning systems as virtual batteries

Este artigo apresenta o VB-NET, uma estrutura de aprendizado profundo cinza-construída e baseada em física que transforma sistemas de ar condicionado em modelos de "bateria virtual" padronizados, superando modelos de caixa-preta convencionais ao garantir consistência física e alcançar alta precisão com dados históricos mínimos.

Yuchen Qi, Ye Guo, Yinliang Xu2026-03-10💻 cs

EmbedTalk: Triplane-Free Talking Head Synthesis using Embedding-Driven Gaussian Deformation

O artigo apresenta o EmbedTalk, um método de síntese de cabeças falantes que substitui as tradicionais triplas por embeddings aprendidos para deformação de Gaussians 3D, resultando em modelos mais compactos, com qualidade superior de renderização e sincronização labial, capazes de operar em tempo real (acima de 60 FPS) em GPUs móveis.

Arpita Saggar, Jonathan C. Darling, Duygu Sarikaya, David C. Hogg2026-03-10💻 cs

Deep Research for Recommender Systems

Este artigo propõe o RecPilot, um novo paradigma de recomendação baseado em agentes que substitui as tradicionais listas de itens por relatórios detalhados e centrados no usuário, reduzindo significativamente o esforço necessário para a avaliação e decisão de compra.

Kesha Ou, Chenghao Wu, Xiaolei Wang, Bowen Zheng, Wayne Xin Zhao, Weitao Li, Long Zhang, Sheng Chen, Ji-Rong Wen2026-03-10💻 cs

From Logs to Agents: Reconstructing High-Level Creative Workflows from Low-Level Raw System Traces

O artigo propõe um método para transformar logs de baixo nível de ferramentas de criatividade em fluxos de trabalho estruturados de alto nível, permitindo que agentes inteligentes compreendam a intenção criativa do usuário e ofereçam assistência contextualizada.

Tae Hee Jo, Kyung Hoon Hyun2026-03-10💻 cs

Beyond Semantic Similarity: Open Challenges for Embedding-Based Creative Process Analysis Across AI Design Tools

O artigo argumenta que a análise de processos criativos baseada apenas em similaridade semântica de embeddings é insuficiente para capturar dinâmicas criativas reais, identificando desafios na medição de significância criativa, no tratamento de traços multimodais e na avaliação de sistemas agênticos, propondo intervenções contextuais com modelos de linguagem para superar essas limitações.

Seung Won Lee, Semin Jin, Kyung Hoon Hyun2026-03-10💻 cs

Looking Into the Water by Unsupervised Learning of the Surface Shape

O artigo propõe um método de aprendizado não supervisionado baseado em redes neurais implícitas (SIREN) para remover distorções de refração em imagens aéreas de água, permitindo a reconstrução da imagem subjacente e a estimativa da forma da superfície da água.

Ori Lifschitz, Tali Treibitz, Dan Rosenbaum2026-03-10💻 cs

Overthinking Causes Hallucination: Tracing Confounder Propagation in Vision Language Models

O artigo propõe que a alucinação em Modelos de Linguagem Visuais resulta de um processo de "superpensamento" onde hipóteses incorretas se propagam através das camadas internas do modelo, e introduz uma nova métrica, o Escore de Superpensamento, que detecta essas instabilidades nas camadas intermediárias para melhorar significativamente a precisão na identificação de alucinações.

Abin Shoby, Ta Duc Huy, Tuan Dung Nguyen, Minh Khoi Ho, Qi Chen, Anton van den Hengel, Phi Le Nguyen, Johan W. Verjans, Vu Minh Hieu Phan2026-03-10💻 cs

Performance Evaluation of Automated Multi-Service Deployment in Edge-Cloud Environments with the CODECO Toolkit

Este artigo avalia o toolkit CODECO, demonstrando que ele reduz significativamente o esforço manual na orquestração de microsserviços em ambientes Edge-Cloud heterogêneos, mantendo desempenho competitivo e sobrecarga aceitável em comparação com fluxos de trabalho Kubernetes padrão.

Georgios Koukis, Ioannis Dermentzis, Vassilis Tsaoussidis, Jan Lenke, Fabian Wolk, Daniel Uceda, Guillermo Sanchez, Miguel A. Puentes, Javier Serrano, Panagiotis Karamolegkos, Rute C. Sofia2026-03-10💻 cs

GeoLoco: Leveraging 3D Geometric Priors from Visual Foundation Model for Robust RGB-Only Humanoid Locomotion

O artigo apresenta o GeoLoco, um framework de locomoção para humanoides que utiliza exclusivamente imagens RGB e aproveita os priores geométricos de um Modelo Visual Fundamental (VFM) congelado para superar as limitações de simulação-para-realidade, permitindo transferência zero-shot robusta para o robô Unitree G1 em terrenos desafiadores.

Yufei Liu, Xieyuanli Chen, Hainan Pan, Chenghao Shi, Yanjie Chen, Kaihong Huang, Zhiwen Zeng, Huimin Lu2026-03-10💻 cs

Duala: Dual-Level Alignment of Subjects and Stimuli for Cross-Subject fMRI Decoding

O artigo apresenta o Duala, um framework de alinhamento em dois níveis que melhora a decodificação visual cruzada entre sujeitos em fMRI ao garantir consistência semântica dos estímulos e alinhamento das respostas cerebrais, alcançando alta precisão mesmo com dados limitados de um único sujeito.

Shumeng Li, Jintao Guo, Jian Zhang, Yulin Zhou, Luyang Cao, Yinghuan Shi2026-03-10💻 cs

Task Breakpoint Generation using Origin-Centric Graph in Virtual Reality Recordings for Adaptive Playback

Este artigo propõe um método baseado em um Gráfico Centrado na Origem (OCG) para gerar automaticamente pontos de interrupção de tarefas em gravações de realidade virtual, permitindo uma reprodução adaptativa e superando as limitações dos métodos existentes que dependem de anotação manual ou são restritos a vídeos 2D.

Selin Choi, Dooyoung Kim, Taewook Ha, Seonji Kim, Woontack Woo2026-03-10💻 cs

Real-Time Glottis Detection Framework via Spatial-decoupled Feature Learning for Nasal Transnasal Intubation

O artigo apresenta o Mobile GlottisNet, um framework de detecção de glote leve e eficiente projetado para inferência em tempo real em dispositivos de borda, utilizando mecanismos de aprendizado de características espacialmente desacopladas para superar as limitações de recursos e latência nos sistemas atuais de intubação nasal.

Jinyu Liu, Gaoyang Zhang, Yang Zhou, Ruoyi Hao, Yang Zhang, Hongliang Ren2026-03-10💻 cs

PoEW:Encryption as Consensus and Enabling Data Compression Services?

Este artigo apresenta o Proof-of-Encryption-Work (PoEW), um novo mecanismo de consenso que transforma o consumo energético da mineração em um serviço útil ao utilizar a busca exaustiva por chaves de criptografia para comprimir dados, onde o processo de compressão é computacionalmente intensivo, mas a descompressão é simples.

Chong Guan2026-03-10💻 cs

Coordination Games on Multiplex Networks: Consensus, Convergence, and Stability of Opinion Dynamics

Este artigo investiga a dinâmica de opiniões em redes sociais multiplex, demonstrando que a interação entre camadas pode induzir ou acelerar o consenso global mesmo quando camadas individuais não o alcançam, ao mesmo tempo em que estabelece condições suficientes para estabilidade e convergência através de modelos de fusão e alternância.

Ruey-An Shiu, Parinaz Naghizadeh2026-03-10💻 cs

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

O artigo apresenta o PanoDP, um framework de aprendizado sem comunicação que combina percepção de profundidade panorâmica de quatro visões com sinais de treinamento baseados em física diferenciável para melhorar a navegação autônoma livre de colisões em ambientes desordenados e dinâmicos.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

Registered Attribute-Based Encryption with Publicly Verifiable Certified Deletion, Everlasting Security, and More

Este artigo apresenta os primeiros esquemas de Criptografia Baseada em Atributos Registrada (RABE) que suportam exclusão certificada e segurança eterna certificada, oferecendo tanto verificações privadas quanto publicamente verificáveis para garantir a destruição irreversível de dados em ambientes descentralizados.

Shayeef Murshid, Ramprasad Sarkar, Mriganka Mandal2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

O artigo apresenta o TempoFit, uma solução de retrofit temporal sem treinamento que melhora a capacidade de manipulação de longo prazo de políticas VLA pré-treinadas ao reutilizar e recuperar memórias de chaves/valores de camadas anteriores, alcançando ganhos significativos de desempenho em tarefas complexas sem aumentar a latência ou exigir novos módulos treináveis.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

O artigo apresenta o AtomicVLA, um framework unificado de planejamento e execução que utiliza uma biblioteca de habilidades atômicas escalável e um mecanismo de especialistas mistos orientados por habilidades para superar as limitações dos modelos VLA existentes em tarefas robóticas de longo horizonte e aprendizado contínuo.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Este artigo propõe um quadro de planeamento de trajetória para exploração multiagente fora da Terra, baseado em mapeamento de crença Gaussiana e cobertura de dupla domínio, que supera as limitações das abordagens existentes ao equilibrar a descoberta de evidências esparsas com a segurança operacional em terrenos perigosos e comunicações restritas.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

← Anterior Próximo →