cs artigos | Gist.Science

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution

O artigo apresenta o ResearchEnvBench, um novo benchmark que avalia a capacidade de agentes autônomos de sintetizar ambientes de execução para código de pesquisa, revelando lacunas significativas nas soluções atuais quanto à resolução de dependências e compatibilidade de versões.

Yubang Wang, Chenxi Zhang, Bowen Chen, Zezheng Huai, Zihao Dai, Xinchi Chen, Yuxin Wang, Yining Zheng, Jingjing Gong, Xipeng Qiu2026-03-10💻 cs

ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins

O artigo apresenta o ViroGym, um benchmark abrangente que avalia modelos de linguagem proteica em proteínas virais utilizando dados de variação profunda e tarefas de neutralização para orientar a seleção racional de antígenos e a previsão de mutações dominantes.

Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab2026-03-10💻 cs

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers

O artigo apresenta o ButterflyViT, um método inovador que supera as limitações de memória linear dos Mixture of Experts (MoE) em Vision Transformers para dispositivos de borda, alcançando uma redução de 354 vezes no uso de memória ao representar especialistas como reorientações geométricas de um substrato compartilhado, mantendo a precisão em tarefas de classificação de imagens.

Aryan Karmore2026-03-10💻 cs

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

Este artigo apresenta uma revisão abrangente dos modelos fundamentais robóticos (RFMs) e propõe um novo framework de avaliação com 149 critérios para analisar sua prontidão industrial, concluindo que, embora promissores, os modelos atuais ainda possuem maturidade limitada para aplicações industriais devido à falta de integração sistemática de segurança, tempo real e robustez.

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

O artigo apresenta o XMACNet, uma rede neural convolucional leve e explicável que combina imagens RGB e índices de vegetação por meio de atenção automática e fusão multimodal para classificar doenças em pimenteiros com alta precisão, superando modelos existentes e permitindo implantação em dispositivos de borda.

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

EarthBridge: A Solution for 4th Multi-modal Aerial View Image Challenge Translation Track

Este artigo apresenta o EarthBridge, um framework de tradução de imagens de alta fidelidade que combina modelos de ponte de difusão implícita e aprendizado contrastivo não emparelhado para converter eficazmente imagens aéreas entre os sensores SAR, EO e IR, alcançando a segunda posição no desafio MAVIC-T.

Zhenyuan Chen, Guanyuan Shen, Feng Zhang2026-03-10💻 cs

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

Este artigo apresenta uma estrutura de co-projeto baseada em gradiente que otimiza conjuntamente a forma aerodinâmica e o planejador de movimento de robôs alados, utilizando um modelo substituto neural para simular fluxos complexos e melhorar o desempenho em tarefas como pousar e aterrissagem curta com maior eficiência computacional do que métodos anteriores.

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

HiDE: Hierarchical Dictionary-Based Entropy Modeling for Learned Image Compression

O artigo apresenta o HiDE, um modelo de compressão de imagens aprendido que utiliza uma estrutura hierárquica de dicionários para explorar priores externos globais e locais, combinada com um estimador de parâmetros adaptativo, alcançando economias significativas de taxa de bits em comparação com o padrão VTM-12.1.

Haoxuan Xiong, Yuanyuan Xu, Kun Zhu, Yiming Wang, Baoliu Ye2026-03-10💻 cs

Efficient Neighbourhood Search in 3D Point Clouds Through Space-Filling Curves and Linear Octrees

Este trabalho apresenta um método eficiente para busca de vizinhança em nuvens de pontos 3D que combina curvas de preenchimento espacial (Morton e Hilbert) com uma implementação linear de Octree, resultando em reduções significativas de falhas de cache e tempos de execução, superando em até 10 vezes soluções existentes e demonstrando alta escalabilidade paralela.

Pablo D. Viñambres, Miguel Yermo, Silvia R. Alcaraz, Oscar G. Lorenzo, Francisco F. Rivera, José C. Cabaleiro2026-03-10💻 cs

Stability-Guided Exploration for Diverse Motion Generation

Este trabalho propõe um método inovador que combina busca estilo RRT com MPC baseada em amostragem e um esquema de amostragem guiado pela estabilidade para gerar, via simulação, estratégias de manipulação diversificadas e de longo horizonte, superando as limitações de dados sintéticos atuais e de demonstrações humanas.

Eckart Cobo-Briesewitz, Tilman Burghoff, Denis Shcherba, Armand Jordana, Marc Toussaint2026-03-10💻 cs

HybridMimic: Hybrid RL-Centroidal Control for Humanoid Motion Mimicking

O artigo apresenta o HybridMimic, um framework que integra controle de RL com um controlador baseado em modelo centróide para permitir que humanoides, como o Booster T1, imitem movimentos humanos com maior robustez e precisão em ambientes dinâmicos, reduzindo o erro de rastreamento em 13% em comparação com métodos de RL tradicionais.

Ludwig Chee-Ying Tay, I-Chia Chang, Yan Gu2026-03-10💻 cs

A Multi-Layer Sim-to-Real Framework for Gaze-Driven Assistive Neck Exoskeletons

Este artigo apresenta um framework multi-camada que utiliza realidade virtual para treinar modelos de previsão de movimento da cabeça baseados no olhar, validando-os em simulação e em um exoesqueleto físico para demonstrar a eficácia de uma abordagem personalizada e segura para o controle assistivo em casos de síndrome de cabeça caída.

Colin Rubow, Eric Brewer, Ian Bales, Haohan Zhang, Daniel S. Brown2026-03-10💻 cs

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

O artigo apresenta o AceMAD, um framework de debate multiagente que supera a "Maldição da Martingala" ao utilizar a assimetria da energia potencial cognitiva para transformar a convergência de erros em um processo direcionado à verdade, permitindo que agentes com conhecimento correto identifiquem e corrijam o consenso enganoso da maioria.

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Este artigo apresenta um modelo híbrido de aprendizado de máquina que combina três CNNs (VGG19, Efficient-Net e ResNet50) com um classificador Bi-LSTM para detectar Cerebral Palsy em imagens de ressonância magnética de recém-nascidos, alcançando uma precisão de 98,83% superior a modelos pré-existentes.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Making AI Evaluation Deployment Relevant Through Context Specification

O artigo propõe a "especificação de contexto" como um processo fundamental para transformar perspectivas difusas das partes interessadas em definições claras e mensuráveis, permitindo que as organizações avaliem e decidam sobre a implementação de IA de forma mais informada e alinhada às realidades operacionais.

Matthew Holmes, Thiago Lacerda, Reva Schwartz2026-03-10💻 cs

Reinforcing the World's Edge: A Continual Learning Problem in the Multi-Agent-World Boundary

Este artigo propõe que o aprendizado contínuo em sistemas multiagente descentralizados surge da instabilidade da fronteira entre agente e mundo, onde atualizações de políticas geram não-estacionariedade que pode destruir estruturas de decisão invariantes essenciais para o sucesso da tarefa.

Dane Malenfant2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

Este estudo desenvolveu um banco de dados abrangente com 23.793 apresentações do Congresso Anual da Sociedade de Pesquisa em Serviço Social (SSWR) de 2005 a 2026, utilizando inteligência artificial e revisão humana para analisar o crescimento da participação, o aumento da colaboração internacional e a predominância contínua de métodos quantitativos na disciplina.

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

A Comprehensive Analysis of the Effects of Network Quality of Service on Robotic Telesurgery

Este artigo apresenta uma análise abrangente sobre como a perda de pacotes, o atraso e a interrupção de comunicação afetam o desempenho e a segurança da telescirurgia, utilizando a ferramenta de injeção de falhas NetFI e um estudo com 15 participantes para identificar os limites operacionais e correlacionar a proficiência do cirurgião com a carga de trabalho subjetiva.

Zhaomeng Zhang, Seyed Hamid Reza Roodabeh, Homa Alemzadeh2026-03-10💻 cs

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

O artigo revela que a qualidade da ancoragem temporal (Step Grounding Rate) em modelos visão-linguagem de longo horizonte é um preditor robusto e independente de sua generalização para dados fora da distribuição, superando a precisão final e o tamanho do modelo como indicadores de confiabilidade.

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

Receding-Horizon Nullspace Optimization for Actuation-Aware Control Allocation in Omnidirectional UAVs

Este artigo propõe uma estratégia de alocação de controle com horizonte recorrente e consciência da atuação para UAVs omnidirecionais, que utiliza otimização no espaço nulo e simulação forward para antecipar e suprimir oscilações causadas por dinâmicas assimétricas dos motores, resultando em um rastreamento de trajetória superior em comparação com métodos convencionais.

Riccardo Pretto, Mahmoud Hamandi, Abdullah Mohamed Ali, Gokhan Alcan, Anthony Tzes, Fares Abu-Dakka2026-03-10💻 cs

← Anterior Próximo →

cs