cs artigos | Gist.Science

FinToolBench: Evaluating LLM Agents for Real-World Financial Tool Use

O artigo apresenta o FinToolBench, o primeiro benchmark executável do mundo real projetado para avaliar agentes de IA no uso de ferramentas financeiras, oferecendo um ecossistema com 760 ferramentas executáveis e um novo framework de avaliação que prioriza a precisão, a conformidade regulatória e a estabilidade em cenários financeiros de alto risco.

Jiaxuan Lu, Kong Wang, Yemin Wang, Qingmei Tang, Hongwei Zeng, Xiang Chen, Jiahao Pi, Shujian Deng, Lingzhi Chen, Yi Fu, Kehua Yang, Xiao Sun2026-03-10💻 cs

Event-based Motion & Appearance Fusion for 6D Object Pose Tracking

Este trabalho propõe um método de aprendizado livre para o rastreamento de pose 6D de objetos que funde fluxo óptico baseado em eventos para propagação de pose com uma correção baseada em templates, superando as limitações de câmeras RGB-D em cenários dinâmicos de alta velocidade.

Zhichao Li, Chiara Bartolozzi, Lorenzo Natale, Arren Glover2026-03-10💻 cs

SAIL: Test-Time Scaling for In-Context Imitation Learning with VLM

O artigo apresenta o SAIL, um quadro de aprendizado por imitação que utiliza busca em árvore Monte Carlo e modelos de linguagem visual para refinar iterativamente trajetórias de robôs durante o teste, demonstrando que aumentar a capacidade de computação no momento da execução melhora significativamente as taxas de sucesso em tarefas de manipulação complexas.

Makoto Sato, Yusuke Iwasawa, Yujin Tang, So Kuroki2026-03-10💻 cs

Prototype-Guided Concept Erasure in Diffusion Models

O artigo "Prototype-Guided Concept Erasure in Diffusion Models" propõe um método que utiliza protótipos derivados da geometria de incorporação latente para identificar e condicionar negativamente representações internas, permitindo a eliminação confiável de conceitos amplos e complexos em modelos de difusão sem comprometer a qualidade da imagem gerada.

Yuze Cai, Jiahao Lu, Hongxiang Shi, Yichao Zhou, Hong Lu2026-03-10💻 cs

Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony

Este artigo demonstra que a simplificação das representações observacionais e a implementação de um mecanismo de atribuição de crédito local (CGCA) permitem uma coordenação robusta e sem comunicação em cenários de perseguição-evasão 3D, superando abordagens dependentes de comunicação em termos de sucesso e resiliência a atrasos e ruídos.

Jialin Ying, Zhihao Li, Zicheng Dong, Guohua Wu, Yihuan Liao2026-03-10💻 cs

OSCAR: Occupancy-based Shape Completion via Acoustic Neural Implicit Representations

O artigo propõe o OSCAR, um método baseado em representações implícitas neurais que realiza a reconstrução completa da anatomia vertebral a partir de imagens de ultrassom parciais sem necessidade de rótulos anatómicos, superando os desafios de sombreamento acústico e obtendo uma melhoria de 80% no desempenho em comparação com os métodos mais avançados.

Magdalena Wysocki, Kadir Burak Buldu, Miruna-Alexandra Gafencu, Mohammad Farid Azampour, Nassir Navab2026-03-10💻 cs

A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection

Este artigo apresenta o BladeChain, um sistema baseado em blockchain que garante a rastreabilidade imutável e auditável das inspeções de pás de motores de aeronaves, integrando agendamento automatizado, proveniência de modelos de IA e registros criptográficos em uma rede de múltiplas partes interessadas para eliminar falhas manuais e prevenir adulterações.

Mahmoud Hafez, Eman Ouda, Mohammed A. Mohammed Eltoum, Khaled Salah, Yusra Abdulrahman2026-03-10💻 cs

Novel Semantic Prompting for Zero-Shot Action Recognition

O artigo apresenta o SP-CLIP, um framework leve que aprimora o reconhecimento de ações zero-shot ao utilizar prompts semânticos estruturados em múltiplos níveis de abstração para alinhar representações de vídeo com descrições textuais ricas, sem a necessidade de modificar os codificadores visuais ou aprender parâmetros adicionais.

Salman Iqbal, Waheed Rehman2026-03-10💻 cs

Deconstructing Multimodal Mathematical Reasoning: Towards a Unified Perception-Alignment-Reasoning Paradigm

Este artigo propõe um paradigma unificado de percepção-alinhamento-raciocínio para o Raciocínio Matemático Multimodal, sistematizando as abordagens atuais através de quatro questões fundamentais e destacando os desafios e direções futuras para superar as limitações na interpretação de diagramas, alinhamento de símbolos e verificação de passos intermediários.

Tianyu Yang, Sihong Wu, Yilun Zhao, Zhenwen Liang, Lisen Dai, Chen Zhao, Minhao Cheng, Arman Cohan, Xiangliang Zhang2026-03-10💻 cs

Silicone Ethernet (SEth): a Nervous System for Robotic Touch

Este artigo apresenta o Silicone Ethernet (SEth), uma solução sem fio que integra sensores de toque, comunicação e transferência de energia em um substrato de silicone condutor, permitindo que neurônios autônomos e sem bateria formam um sistema nervoso para robôs macios com baixo consumo de energia e capacidade de priorização de tráfego.

Mengyao Liu, Dag Malstaf, Jonathan Oostvogels, Sam Michiels, Alexander Badri-Spröwitz, Danny Hughes2026-03-10💻 cs

SoK: Harmonizing Attack Graphs and Intrusion Detection Systems

Este artigo apresenta a primeira análise sistemática da integração entre Gráficos de Ataque e Sistemas de Detecção de Intrusão, propondo um novo ciclo de vida formal que estabelece um loop de feedback contínuo para superar a falta de um framework unificado e aprimorar a detecção e resposta a ameaças.

Andrea Agiollo, Enkeleda Bardhi, Alessandro Palma, Riccardo Lazzeretti, Silvia Bonomi, Fernando Kuipers2026-03-10💻 cs

Do Models See in Line with Human Vision? Probing the Correspondence Between LVLM Representations and EEG Signals

Este artigo demonstra que os Modelos de Linguagem e Visão (LVLMs) aprendem representações visuais alinhadas à cognição humana, estabelecendo a correspondência neural com sinais de EEG como um benchmark biologicamente fundamentado para avaliar e melhorar esses modelos.

Xin Xiao, Yang Lei, Haoyang Zeng, Xiao Sun, Xinyi Jiang, Yu Tian, Hao Wu, Kaiwen Wei, Jiang Zhong2026-03-10💻 cs

Retrieval-Augmented Anatomical Guidance for Text-to-CT Generation

O artigo propõe uma abordagem de geração de imagens de CT a partir de texto que utiliza a recuperação de casos clínicos relacionados para fornecer orientação anatômica explícita via ControlNet, melhorando a fidelidade e a consistência clínica dos modelos generativos volumétricos sem depender de anotações de referência.

Daniele Molino, Camillo Maria Caruso, Paolo Soda, Valerio Guarrasi2026-03-10💻 cs

Adaptive Tracking Control of Euler-Lagrange Systems with Time-Varying State and Input Constraints

Este artigo apresenta um quadro de controle adaptativo para sistemas de Euler-Lagrange que garante o cumprimento de restrições de estado e entrada variantes no tempo, na presença de incertezas e perturbações, através da integração de uma função de Lyapunov de barreira variante no tempo com uma lei de controle saturada e uma condição de viabilidade verificável offline, cuja eficácia foi validada experimentalmente em um modelo de helicóptero de 2 graus de liberdade.

Poulomee Ghosh, Shubhendu Bhasin2026-03-10💻 cs

HDR-NSFF: High Dynamic Range Neural Scene Flow Fields

O artigo apresenta o HDR-NSFF, um novo paradigma que substitui a fusão tradicional de imagens 2D por uma modelagem espaço-temporal 4D contínua para reconstruir campos de radiância de alta faixa dinâmica a partir de vídeos monoculares com exposições alternadas, superando artefatos de fantasmas e garantindo consistência temporal em cenas dinâmicas.

Shin Dong-Yeon, Kim Jun-Seong, Kwon Byung-Ki, Tae-Hyun Oh2026-03-10💻 cs

Human-AI Divergence in Ego-centric Action Recognition under Spatial and Spatiotemporal Manipulations

Este estudo compara o desempenho humano e de IA no reconhecimento de ações em primeira pessoa, revelando que humanos dependem de pistas espaciais críticas e esparsas para identificar ações, enquanto os modelos atuais degradam-se de forma mais gradual, baseando-se excessivamente em contextos e características de baixo nível, o que evidencia uma divergência fundamental na robustez e nos mecanismos de reconhecimento entre ambos.

Sadegh Rahmaniboldaji, Filip Rybansky, Quoc C. Vuong, Anya C. Hurlbert, Frank Guerin, Andrew Gilbert2026-03-10💻 cs

CORE-Acu: Structured Reasoning Traces and Knowledge Graph Safety Verification for Acupuncture Clinical Decision Support

O artigo apresenta o CORE-Acu, um framework neuro-simbólico para suporte à decisão clínica em acupuntura que integra rastreamento de raciocínio estruturado e verificação de segurança baseada em grafos de conhecimento para garantir interpretabilidade e eliminar violações de segurança.

Liuyi Xu, Yun Guo, Ming Chen, Zihan Dun, Yining Qian, An-Yang Lu, Shuang Li, Lijun Liu2026-03-10💻 cs

EndoSERV: A Vision-based Endoluminal Robot Navigation System

O artigo apresenta o EndoSERV, um sistema de navegação robótica endoluminal baseado em visão que supera desafios como deformação tecidual e falta de marcos distintivos, utilizando mapeamento segmentar e transferência real-virtual para estimar a odometria sem necessidade de rótulos de pose reais.

Junyang Wu, Fangfang Xie, Minghui Zhang, Hanxiao Zhang, Jiayuan Sun, Yun Gu, Guang-Zhong Yang2026-03-10💻 cs

Turn Complexity of Context-free Languages, Pushdown Automata and One-Counter Automata

Este artigo demonstra que a decidibilidade da limitação do número de viradas em autômatos de pilha e de um contador é indecidível, estabelece uma troca não recursiva entre diferentes classes de autômatos com restrições de viradas e prova a existência de uma hierarquia infinita de complexidade baseada em funções sublineares do número de viradas.

Giovanni Pighizzini2026-03-10💻 cs

Detecting Fake Reviewer Groups in Dynamic Networks: An Adaptive Graph Learning Method

O artigo propõe o modelo DS-DGA-GCN, uma nova rede de aprendizado em grafos que combina atenção dinâmica e pontuação de características de rede para detectar grupos de revisores falsos em cenários de dados esparsos, superando os métodos atuais com alta precisão em conjuntos de dados reais.

Jing Zhang, Ke Huang, Yao Zhang, Bin Guo, Zhiwen Yu2026-03-10💻 cs

← Anterior Próximo →