cs artigos | Gist.Science

Agentified Assessment of Logical Reasoning Agents

Os autores apresentam um framework de avaliação baseado em agentes para testar raciocínio lógico, demonstrando sua eficácia ao benchmarkar um agente de auto-formalização no conjunto de dados FOLIO, onde ele superou uma linha de base de cadeia de pensamento com 86,70% de precisão.

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Required-edge Cycle Cover Problem: an ASP-Completeness Framework for Graph Problems and Puzzles

Este artigo apresenta o Problema de Cobertura de Ciclos com Arestas Obrigatórias (RCCP) como um novo framework para provar a ASP-completude de diversos quebra-cabeças de papel e lápis, resolvendo problemas em aberto e refinando classificações de complexidade para jogos como Kakuro, Chocona e Hinge.

Kosuke Susukita, Junichi Teruyama2026-03-10💻 cs

Sharing is caring: Attestable and Trusted Workflows out of Distrustful Components

O artigo apresenta o Mica, uma arquitetura de computação confidencial baseada em Arm CCA que elimina a necessidade de confiança entre componentes ao fornecer mecanismos explícitos para definir, restringir e atestar todos os caminhos de comunicação, garantindo assim a confidencialidade dos dados em fluxos de trabalho em nuvem complexos com um aumento mínimo na base de código confiável.

Amir Al Sadi, Sina Abdollahi, Adrien Ghosn, Hamed Haddadi, Marios Kogias2026-03-10💻 cs

LDP-Slicing: Local Differential Privacy for Images via Randomized Bit-Plane Slicing

Este artigo apresenta o LDP-Slicing, um framework leve e sem treinamento que supera as limitações de utilidade da Privacidade Diferencial Local em imagens ao decompor os pixels em planos de bits e aplicar mecanismos de privacidade diretamente nessa representação binária, resultando em imagens com alta utilidade para tarefas downstream sem comprometer a privacidade rigorosa.

Yuanming Cao, Chengqi Li, Wenbo He2026-03-10💻 cs

RISCBench: Benchmarking RISC-V Orchestration Efficiency in FPGA and FPGA-Like Computing Engines

O artigo apresenta o RISCBench, uma metodologia e conjunto de benchmarks de código aberto que introduz a métrica de "Throughput Sustentado Instantâneo" (SIT) para avaliar a eficiência de orquestração de núcleos RISC-V em sistemas heterogêneos, superando as limitações das métricas de desempenho convencionais ao focar em fatores como sincronização e residência de dados.

Dave Ojika, Projjal Gupta, Preethi Budi + 2 more2026-03-10💻 cs

Converting Binary Floating-Point Numbers to Shortest Decimal Strings: An Experimental Review

Este artigo apresenta uma revisão experimental comparando algoritmos de conversão de ponto flutuante para strings decimais, demonstrando que técnicas modernas como Schubfach e Dragonbox superam significativamente o Dragon4 em velocidade, embora nenhuma das implementações analisadas, incluindo as bibliotecas padrão, garanta consistentemente a geração das strings decimais mais curtas possíveis.

Jaël Champagne Gareau, Daniel Lemire2026-03-10💻 cs

AI-Powered Multi-Stakeholder Ecosystems for Global Development: A Design Research Study on the GSI D-Hub Proof-of-Concept Platform

Este estudo apresenta a plataforma GSI D-Hub, um ecossistema digital baseado em inteligência artificial explicável que facilita a coordenação transparente entre múltiplos stakeholders para o desenvolvimento global, demonstrando como algoritmos interpretáveis e governança de dados podem aumentar a confiança e a eficiência na colaboração pública.

Muzakkiruddin Ahmed Mohammed, Adeeba Tarannum, Eileen Devereux Dailey + 3 more2026-03-10💻 cs

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Este estudo avalia a vulnerabilidade de migrantes da África Subsaariana à fraude impulsionada por IA, concluindo que a exposição prévia a alvos é o principal fator de risco, enquanto a confiança na identificação de conteúdo gerado por IA e o esforço comportamental de verificação atuam como fatores protetores significativos.

Deborah Oluwasanya2026-03-10💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Este artigo apresenta uma arquitetura de controle de ética por design que integra raciocínios éticos em mecanismos de aplicação ao longo do ciclo de vida da IA, utilizando uma estrutura de três portões (métricos, de governança e ecológicos) para traduzir compromissos normativos em controles operacionais testáveis e integráveis aos pipelines de MLOps.

Jasper Kyle Catapang2026-03-10💻 cs

Causal Analysis of Author Demographics in Academic Peer Review

Este estudo emprega inferência causal para demonstrar que autores de grupos raciais minoritários, mulheres e instituições do Sul Global enfrentam desvantagens estatisticamente significativas nos rankings de aceitação de artigos acadêmicos, evidenciando a necessidade urgente de intervenções para mitigar vieses nos processos de revisão tradicionais e baseados em IA.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan Gauch2026-03-10💻 cs

Performance Comparison of IBN orchestration using LLM and SLMs

Este artigo apresenta um novo framework de orquestração para Redes Baseadas em Intenção (IBN) em redes 5G e 6G, utilizando uma arquitetura multiagente hierárquica com SLMs e LLMs, demonstrando que os SLMs oferecem precisão de tradução comparável enquanto aceleram o ciclo de vida da IBN em 20%.

Wai Lwin Phone, Brahim El Boudani, Tasos Dagiuklas, Saptarshi Ghosh2026-03-10💻 cs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

O artigo apresenta o ObjChangeVR, um novo framework e dataset (ObjChangeVR-Dataset) projetados para superar os desafios de detectar mudanças de estado de objetos em ambientes de realidade virtual a partir de visões egocêntricas contínuas, especialmente quando ocorrem sem interação direta do usuário, demonstrando desempenho superior em comparação com abordagens de base.

Shiyi Ding, Shaoen Wu, Ying Chen2026-03-10💻 cs

Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis

Este artigo propõe um framework de consistência de margem com pontuação de fidelidade a perturbações para subtipar adenocarcinoma pulmonar invasivo em imagens de lâminas inteiras, alcançando alta precisão e robustez a variações de imagem e generalização entre instituições.

Meghdad Sabouri Rad (Vincent), Junze (Vincent), Huang, Mohammad Mehdi Hosseini, Rakesh Choudhary, Saverio J. Carello, Ola El-Zammar, Michel R. Nasr, Bardia Rodd2026-03-10💻 cs

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment

O artigo apresenta o PaLMR, um framework que alinha tanto o resultado quanto o processo de raciocínio em modelos multimodais por meio de dados conscientes da percepção e uma fusão hierárquica de recompensas, reduzindo significativamente alucinações e alcançando resultados de ponta em benchmarks de raciocínio visual.

Yantao Li, Qiang Hui, Chenyang Yan, Kanzhi Cheng, Fang Zhao, Chao Tan, Huanling Gao, Jianbing Zhang, Kai Wang, Xinyu Dai, Shiguo Lian2026-03-10💻 cs

Digital Twin-Enabled Mobility-Aware Cooperative Caching in Vehicular Edge Computing

Este artigo propõe o framework DAPR, que integra Aprendizado Federado Assíncrono, um modelo preditivo GRU-VAE e Aprendizado por Reforço Profundo para otimizar o cache cooperativo em computação de borda veicular, superando as limitações de seleção de clientes e precisão preditiva dos métodos tradicionais.

Jiahao Zeng, Zhenkui Shi, Chunpei Li, Mengkai Yan, Hongliang Zhang, Sihan Chen, Xiantao Hu, Xianxian Li2026-03-10💻 cs

A Parameter-efficient Convolutional Approach for Weed Detection in Multispectral Aerial Imagery

O artigo apresenta o FCBNet, um modelo eficiente para segmentação de ervas daninhas em imagens aéreas multiespectrais que, ao utilizar um backbone ConvNeXt congelado e um bloco de correção de recursos, supera diversos modelos existentes em precisão (mIoU > 85%) e eficiência computacional, reduzindo os parâmetros treináveis em mais de 90%.

Leo Thomas Ramos, Angel D. Sappa2026-03-10💻 cs

GameVerse: Can Vision-Language Models Learn from Video-based Reflection?

O artigo apresenta o GameVerse, um benchmark abrangente que demonstra como Modelos Visuais-Linguísticos podem aprimorar suas políticas de jogo através de um ciclo reflexivo que combina a análise de falhas e tutoriais em vídeo, funcionando como uma alternativa sem treinamento ao aprendizado por reforço e ao ajuste fino supervisionado.

Kuan Zhang, Dongchen Liu, Qiyue Zhao, Jinkun Hou, Xinran Zhang, Qinlei Xie, Miao Liu, Yiming Li2026-03-10💻 cs

ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

O artigo apresenta o ASMIL, um novo quadro unificado de aprendizado múltiplo de instâncias estabilizado por atenção que supera as limitações de instabilidade dinâmica, superajuste e concentração excessiva em imagens de lâminas inteiras, alcançando melhorias significativas no desempenho em comparação com os métodos mais avançados.

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Este capítulo examina o potencial da inteligência artificial generativa para promover a coerência no ensino, aprendizagem e avaliação da alfabetização científica nos níveis K-16+, abordando seus benefícios, desafios e a arquitetura necessária para sua implementação.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam Biswas2026-03-10💻 cs

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting

O artigo propõe o Graph-of-Mark (GoM), uma técnica de prompting visual baseada em grafos que sobrepõe grafos de cena às imagens para melhorar o raciocínio espacial e a capacidade de localização de modelos de linguagem multimodais, superando as limitações de métodos anteriores ao capturar explicitamente as relações entre os objetos.

Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro2026-03-10💻 cs

← Anterior Próximo →