cs.AI artigos | Gist.Science

Explicit Logic Channel for Validation and Enhancement of MLLMs on Zero-Shot Tasks

Este artigo propõe um "Canal de Lógica Explícito" que, operando em paralelo com modelos multimodais de grande escala (MLLMs) de caixa preta, utiliza raciocínio lógico e inferência probabilística para validar, selecionar e aprimorar o desempenho desses modelos em tarefas zero-shot sem necessidade de anotações de referência, aumentando assim sua confiabilidade e explicabilidade.

Mei Chee Leong, Ying Gu, Hui Li Tan, Liyuan Li, Nancy Chen2026-03-13🤖 cs.AI

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure Transformer for Offline Multi-task Multi-agent Reinforcement Learning

O artigo apresenta o STAIRS-Former, uma nova arquitetura baseada em transformadores com hierarquias espaciais e temporais e um mecanismo de *dropout* de tokens, que supera os métodos anteriores em aprendizado por reforço multiagente offline multi-tarefa ao capturar dependências temporais de longo prazo e coordenar agentes com populações variáveis, alcançando desempenho superior em diversos benchmarks.

Jiwon Jeon, Myungsik Cho, Youngchul Sung2026-03-13🤖 cs.AI

OSCBench: Benchmarking Object State Change in Text-to-Video Generation

O artigo apresenta o OSCBench, um novo benchmark baseado em dados culinários para avaliar a capacidade de modelos de geração de vídeo a partir de texto em realizar mudanças de estado de objetos especificadas no prompt, revelando que, apesar dos avanços na qualidade visual e alinhamento semântico, os modelos atuais ainda lutam para gerar transformações de objetos precisas e consistentes, especialmente em cenários novos e composicionais.

Xianjing Han, Bin Zhu, Shiqi Hu, Franklin Mingzhe Li, Patrick Carrington, Roger Zimmermann, Jingjing Chen2026-03-13💬 cs.CL

Scaling Laws for Educational AI Agents

Este artigo propõe a "Lei de Escala de Agentes", um framework que demonstra que a capacidade de agentes educacionais de IA escala de forma previsível com a riqueza estrutural de seus perfis definidos em JSON (AgentProfile), em vez de depender exclusivamente do tamanho do modelo subjacente, como evidenciado pela plataforma EduClaw e seus mais de 330 perfis de agentes.

Mengsong Wu, Hao Hao, Shuzhen Bi, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

Affect Decoding in Phonated and Silent Speech Production from Surface EMG

Este artigo apresenta um novo conjunto de dados e demonstra que a atividade muscular facial e cervical, captada por eletromiografia de superfície (sEMG), permite decodificar com precisão estados afetivos como a frustração tanto na fala vocalizada quanto na silenciosa, validando o potencial dessa tecnologia para interfaces de fala silenciosa conscientes das emoções.

Simon Pistrosch, Kleanthis Avramidis, Tiantian Feng, Jihwan Lee, Monica Gonzalez-Machorro, Shrikanth Narayanan, Björn W. Schuller2026-03-13⚡ eess

When OpenClaw Meets Hospital: Toward an Agentic Operating System for Dynamic Clinical Workflows

Este trabalho propõe uma arquitetura de Sistema Operacional Agente para hospitais, baseada no framework OpenClaw, que integra um ambiente de execução restrito, interações centradas em documentos, memória indexada por páginas e uma biblioteca de habilidades médicas para permitir a automação segura e auditável de fluxos de trabalho clínicos dinâmicos.

Wenxian Yang, Hanzheng Qiu, Bangqun Zhang, Chengquan Li, Zhiyong Huang, Xiaobin Feng, Rongshan Yu, Jiahong Dong2026-03-13🤖 cs.AI

Adapting Dijkstra for Buffers and Unlimited Transfers

Este trabalho apresenta o Transfer Aware Dijkstra (TAD), um algoritmo que supera as limitações do filtramento de conexões em buffers ao processar sequências completas de viagens, demonstrando ser mais rápido e preciso que o MR em redes de transporte público com tempos de espera e transferências ilimitadas.

Denys Katkalo, Andrii Rohovyi, Toby Walsh2026-03-13🤖 cs.AI

Gender Bias in Generative AI-assisted Recruitment Processes

Este estudo avalia o viés de gênero em processos de recrutamento assistidos por IA generativa (GPT-5) no contexto de graduados italianos, revelando que, embora as sugestões de cargos sejam neutras, o modelo perpetua estereótipos ao atribuir adjetivos emocionais e empáticos às mulheres e características estratégicas e analíticas aos homens.

Martina Ullasci, Marco Rondina, Riccardo Coppola, Antonio Vetrò2026-03-13🤖 cs.AI

CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

O artigo apresenta o CINDI, um framework probabilístico não supervisionado baseado em fluxos normalizadores condicionais que unifica a detecção de anomalias e a imputação de dados em séries temporais multivariadas de redes elétricas, oferecendo uma solução robusta e escalável para restaurar a integridade de dados corrompidos por ruído.

David Baumgartner, Helge Langseth, Heri Ramampiaro2026-03-13🤖 cs.AI

Compression Favors Consistency, Not Truth: When and Why Language Models Prefer Correct Information

O artigo demonstra que o viés de verdade em modelos de linguagem não é uma busca intrínseca pela verdade, mas sim um efeito colateral da pressão de compressão que favorece hipóteses com descrições internas mais consistentes e compactas, mesmo quando os dados de treinamento contêm erros.

Konstantin Krestnikov2026-03-13💬 cs.CL

Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

Este artigo propõe um método de detecção de anomalias em séries temporais multivariadas que, ao invés de depender da verossimilhança no espaço de observação, utiliza fluxos normalizadores condicionais com viés indutivo para restringir as representações latentes a dinâmicas temporais prescritas, permitindo identificar anomalias como violações dessas dinâmicas através de testes estatísticos de aderência.

David Baumgartner, Eliezer de Souza da Silva, Iñigo Urteaga2026-03-13🤖 cs.AI

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Este artigo propõe um algoritmo de aprendizado de banda social baseado em energia livre que permite a um agente avaliar e integrar as políticas de outros agentes sem conhecimento de suas recompensas, demonstrando convergência teórica e superioridade empírica ao explorar eficazmente a expertise de agentes não especialistas e diversos para melhorar o aprendizado individual com arrependimento logarítmico.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili Ahmadabadi2026-03-13📊 stat

Understanding Wikidata Qualifiers: An Analysis and Taxonomy

Este artigo apresenta uma análise detalhada e uma taxonomia refinada dos qualificadores do Wikidata, desenvolvida para orientar contribuidores, aprimorar sistemas de recomendação e melhorar o design de grafos de conhecimento ao abordar desafios semânticos e de inferência lógica.

Gilles Falquet, Sahar Aljalbout2026-03-13🤖 cs.AI

Governing Evolving Memory in LLM Agents: Risks, Mechanisms, and the Stability and Safety Governed Memory (SSGM) Framework

Este artigo propõe o framework de Memória Governada por Estabilidade e Segurança (SSGM), uma arquitetura conceitual que mitiga riscos como corrupção de memória, deriva semântica e vazamento de dados em agentes de LLM ao desacoplar a evolução da memória da execução através de verificação de consistência, modelagem de decaimento temporal e controle de acesso dinâmico.

Chingkwun Lam, Jiaxin Li, Lingfei Zhang, Kuo Zhao2026-03-13🤖 cs.AI

An Automatic Text Classification Method Based on Hierarchical Taxonomies, Neural Networks and Document Embedding: The NETHIC Tool

O artigo apresenta o NETHIC, uma ferramenta de classificação automática de texto que combina redes neurais escaláveis, taxonomias hierárquicas e incorporação de documentos para alcançar resultados eficazes e eficientes em corpora genéricos e específicos de domínio.

Luigi Lomasto, Rosario Di Florio, Andrea Ciapetti, Giuseppe Miscione, Giulia Ruggiero, Daniele Toti2026-03-13🤖 cs.AI

From Debate to Deliberation: Structured Collective Reasoning with Typed Epistemic Acts

O artigo apresenta a Inteligência Coletiva Deliberativa (DCI), um framework que estrutura a interação de múltiplos agentes de IA por meio de atos epistêmicos tipificados e um algoritmo de convergência, demonstrando que essa abordagem deliberativa melhora significativamente o desempenho em tarefas não rotineiras e de integração de perspectivas, embora gere um alto custo computacional e seja menos eficaz em decisões rotineiras.

Sunil Prakash2026-03-13🤖 cs.AI

HELM: Hierarchical and Explicit Label Modeling with Graph Learning for Multi-Label Image Classification

O artigo apresenta o HELM, um novo framework que combina tokens de classe específicos de hierarquia, redes neurais convolucionais em grafos e aprendizado auto-supervisionado para alcançar desempenho superior na classificação multi-rótulo de imagens de sensoriamento remoto, especialmente em cenários com poucos dados rotulados.

Marjan Stoimchev, Boshko Koloski, Jurica Levatic, Dragi Kocev, Sašo Džeroski2026-03-13🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

Este artigo propõe um método de auditoria de justiça mecanicista que localiza e mitiga vieses demográficos em cabeças de atenção individuais do codificador de visão do CLIP, demonstrando que o viés de gênero é mais localizável e passível de correção do que o viés de idade.

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-Pineau2026-03-13🤖 cs.AI

DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

O DocSage é um framework agêntico inovador que supera as limitações dos sistemas RAG e LLMs existentes na resposta a perguntas sobre múltiplos documentos e entidades, utilizando descoberta dinâmica de esquemas, extração estruturada de informações e raciocínio relacional para alcançar melhorias significativas de precisão.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

A Semi-Decentralized Approach to Multiagent Control

Este artigo apresenta o framework SDec-POMDP e o algoritmo exato RS-SDA* para o controle semi-descentralizado de agentes cooperativos em ambientes com incerteza de comunicação, unificando modelos existentes e oferecendo uma base teórica robusta para problemas de comunicação multiagente.

Mahdi Al-Husseini, Mykel J. Kochenderfer, Kyle H. Wray2026-03-13🤖 cs.AI

← Anterior Próximo →