cs artigos | Gist.Science

OrdinalBench: A Benchmark Dataset for Diagnosing Generalization Limits in Ordinal Number Understanding of Vision-Language Models

O artigo apresenta o OrdinalBench, um novo conjunto de dados de benchmark com 39.000 pares de perguntas e respostas projetado para diagnosticar as limitações de generalização de Modelos Visão-Linguagem na compreensão de números ordinais, revelando que modelos de ponta sofrem degradação significativa ao lidar com grandes índices e caminhos complexos.

Yusuke Tozaki, Hisashi Miyamori2026-03-10💻 cs

SGI: Structured 2D Gaussians for Efficient and Compact Large Image Representation

O artigo apresenta o SGI (Structured Gaussian Image), um framework compacto e eficiente que representa imagens de alta resolução utilizando Gaussians neurais 2D estruturados baseados em sementes e uma estratégia de ajuste multiescala, alcançando compressão superior e convergência mais rápida sem comprometer a fidelidade da imagem.

Zixuan Pan, Kaiyuan Tang, Jun Xia, Yifan Qin, Lin Gu, Chaoli Wang, Jianxu Chen, Yiyu Shi2026-03-10💻 cs

4DRC-OCC: Robust Semantic Occupancy Prediction Through Fusion of 4D Radar and Camera

Este trabalho apresenta o 4DRC-OCC, a primeira abordagem que combina dados de radar 4D e câmeras para previsão robusta de ocupação semântica 3D, aproveitando as medições confiáveis do radar em condições adversas e as informações semânticas da câmera, além de introduzir um novo conjunto de dados rotulados automaticamente para reduzir a dependência de anotação manual.

David Ninfa, Andras Palffy, Holger Caesar2026-03-10💻 cs

A Robust Antenna Provides Tactile Feedback in a Multi-legged Robot

Este artigo apresenta um robô multirrasteiro equipado com antenas táteis de complacência gradativa que, ao mapear a deformação mecânica em estados de colisão, permitem navegação autônoma e recuperação de travamentos em ambientes confinados sem necessidade de visão ou informações globais.

Zhaochen J. Xu, Juntao He, Delfin Aydan, Malaika Taylor, Tianyu Wang, Jianfeng Lin, Wesley Dyer, Daniel I. Goldman2026-03-10💻 cs

Inverse Resistive Force Theory (I-RFT): Learning granular properties through robot-terrain physical interactions

Este artigo apresenta o Inverse Resistive Force Theory (I-RFT), um framework de aprendizado de máquina informado por física que integra a Teoria da Força Resistiva Granular com Processos Gaussianos para inferir com precisão as propriedades mecânicas de terrenos granulares a partir de forças de contato medidas durante locomoção natural, permitindo a otimização de design de pés e trajetórias de marcha para exploração autônoma.

Shipeng Liu, Feng Xue, Yifeng Zhang, Tarunika Ponnusamy, Feifei Qian2026-03-10💻 cs

MWM: Mobile World Models for Action-Conditioned Consistent Prediction

O artigo apresenta o MWM, um modelo de mundo móvel que utiliza um treinamento em duas etapas e uma distilação consistente com a inferência para garantir previsões visualmente fiéis e coerentes com as ações, melhorando significativamente a navegação baseada em planejamento e a eficiência de inferência.

Han Yan, Zishang Xiang, Zeyu Zhang, Hao Tang2026-03-10💻 cs

Preference-Conditioned Reinforcement Learning for Space-Time Efficient Online 3D Bin Packing

O artigo propõe o STEP, uma abordagem de aprendizado por reforço baseada em Transformers e condicionada a preferências que otimiza o empacotamento 3D online ao equilibrar dinamicamente a densidade de espaço e o tempo de execução, resultando em uma redução de 44% no tempo operacional sem comprometer a eficiência do espaço.

Nikita Sarawgi, Omey M. Manyar, Fan Wang, Thinh H. Nguyen, Daniel Seita, Satyandra K. Gupta2026-03-10💻 cs

Which Vertical Graphs are Non VPHT Reconstructible?

Este artigo investiga as condições de não reconstrutibilidade da Transformada de Homologia Persistente Verbose (VPHT) em grafos cujos vértices são colineares, identificando propriedades necessárias e suficientes para casos de degenerescência onde a transformada deixa de ser injetiva.

Jette Gutzeit, Kalani Kistler, Tim Ophelders, Anna Schenfisch2026-03-10💻 cs

Temperature-Aware Scheduling of LLM Inference in Large-Scale Geo-Distributed Edge Data Centers with Distributed Optimization

Este estudo propõe uma abordagem de agendamento consciente da temperatura baseada em otimização distribuída para co-otimizar custos energéticos, emissões de carbono, tempo até o primeiro token e consumo de água em data centers de borda geo-distribuídos na Austrália, visando mitigar o impacto ambiental da inferência de Grandes Modelos de Linguagem (LLMs).

Arash Khalatbarisoltani, Amin Mahmoudi, Jie Han, Muhammad Saeed, Wenxue Liu, Jinwen Li, Solmaz Kahourzade, Amirmehdi Yazdani, Xiaosong Hu2026-03-10💻 cs

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Este estudo analisa a governança de conteúdo gerado por IA em 40 plataformas de mídia social, constatando que a maioria foca apenas na moderação de violações e na divulgação da origem do conteúdo, enquanto sugere que stakeholders e formuladores de políticas desenvolvam estruturas mais abrangentes, diretas e orientadas para o futuro, incluindo ferramentas e educação para os usuários.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini Chetty2026-03-10💻 cs

HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

O artigo apresenta o HybridStitch, um novo paradigma de geração de imagens que acelera os modelos de difusão ao dividir a imagem em regiões simples e complexas, utilizando um modelo menor para esboçar as áreas fáceis e um modelo maior para refinar as áreas complexas, alcançando um aumento de velocidade de 1,83× no Stable Diffusion 3.

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Tracking Phenological Status and Ecological Interactions in a Hawaiian Cloud Forest Understory using Low-Cost Camera Traps and Visual Foundation Models

Este projeto utiliza armadilhas fotográficas de baixo custo e modelos de visão computacional fundamentais na Reserva Natural Pu'u Maka'ala, no Havaí, para monitorar a fenologia vegetal e as interações flora-fauna em nível individual, revelando tendências ecológicas que métodos tradicionais não conseguem detectar.

Luke Meyers, Anirudh Potlapally, Yuyan Chen, Mike Long, Tanya Berger-Wolf, Hari Subramoni, Remi Megret, Daniel Rubenstein2026-03-10💻 cs

A Curved Monopole Antenna for HF Radar with Enhanced Gain and Bandwidth

Este artigo apresenta o projeto e a simulação de uma nova antena monopolo curva otimizada para radares HF de onda celeste, que, ao incorporar uma seção reta e curvatura controlada, alcança ganho e largura de banda superiores em comparação com monopolos convencionais, estendendo-se com sucesso a um arranjo linear de 12 elementos para aplicações de radar além do horizonte.

Masoud Salmani Arani, Reza Shahidi, Lihong Zhang2026-03-10💻 cs

Broken Access: On the Challenges of Screen Reader Assisted Two-Factor and Passwordless Authentication

Este artigo apresenta o framework AWARE para avaliar a segurança e acessibilidade de métodos de autenticação assistidos por leitores de tela, revelando vulnerabilidades críticas em esquemas de dois fatores e sem senha que expõem usuários cegos e com deficiência visual a diversos vetores de ataque.

Md Mojibur Rahman Redoy Akanda (Texas A&M University), Ahmed Tanvir Mahdad (Texas A&M University), Nitesh Saxena (Texas A&M University)2026-03-10💻 cs

Uncertainty Mitigation and Intent Inference: A Dual-Mode Human-Machine Joint Planning System

O artigo propõe um sistema unificado de planejamento conjunto humano-robô que opera em dois modos complementares — mitigação de incerteza por meio de diálogo ativo e inferência de intenção latente baseada em pistas espaciais — para reduzir significativamente os custos de interação e o tempo de execução em ambientes abertos.

Zeyu Fang, Yuxin Lin, Cheng Liu, Beomyeol Yu, Zeyuan Yang, Rongqian Chen, Taeyoung Lee, Mahdi Imani, Tian Lan2026-03-10💻 cs

Leveraging Quantum Annealing for Large-Scale Household Energy Scheduling with Hydrogen Storage

Este artigo apresenta um framework hierárquico de controle preditivo baseado em recozimento quântico para otimizar o agendamento de energia em microrredes com armazenamento de hidrogênio, demonstrando que essa abordagem supera os métodos tradicionais em escalabilidade à medida que aumenta o número de residências conectadas.

Arash Khalatbarisoltani, Amin Mahmoudi, Jie Han, Muhammad Saeed, Wenxue Liu, Jinwen Li, Solmaz Kahourzade, Amirmehdi Yazdani, Xiaosong Hu2026-03-10💻 cs

Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation

Este artigo apresenta o MINT, um novo quadro de colaboração para drones que utiliza modelos de linguagem grandes para formular consultas ativas e resolver lacunas de conhecimento de forma eficiente, reduzindo a interação humana e aumentando as taxas de sucesso em tarefas complexas de busca e resgate.

Zeyu Fang, Beomyeol Yu, Cheng Liu, Zeyuan Yang, Rongqian Chen, Yuxin Lin, Mahdi Imani, Tian Lan2026-03-10💻 cs

Physics-infused Learning for Aerial Manipulator in Winds and Near-Wall Environments

Este artigo apresenta um quadro de controle unificado para manipuladores aéreos que combina um modelo aerodinâmico baseado em física com um estimador residual aprendido para compensar perturbações do vento e efeitos de proximidade com paredes, permitindo operações robustas de contato em ambientes desafiadores.

Yiming Zhang, Junyi Geng2026-03-10💻 cs

A Novel Phase-Noise Module for the QUCS Circuit Simulator. Part II : Noise Analysis

Este artigo descreve a implementação de um novo módulo de análise de ruído de fase no simulador de circuitos QUCS, baseado em uma metodologia unificada de domínio temporal que supera as abordagens empíricas anteriores e oferece capacidades de simulação estocástica superiores às ferramentas comerciais para circuitos osciladores acoplados em regime permanente.

Torsten Djurhuus, Viktor Krozer2026-03-10💻 cs

GazeShift: Unsupervised Gaze Estimation and Dataset for VR

O artigo apresenta o GazeShift, um framework de estimativa de olhar não supervisionado e o dataset VRGaze, que juntos oferecem uma solução eficiente em tempo real e com poucos parâmetros para rastreamento de olhar em realidade virtual, superando a escassez de dados rotulados em configurações de câmeras off-axis.

Gil Shapira, Ishay Goldin, Evgeny Artyomov, Donghoon Kim, Yosi Keller, Niv Zehngut2026-03-10💻 cs

← Anterior Próximo →