cs.AI artigos | Gist.Science

From Variance to Invariance: Qualitative Content Analysis for Narrative Graph Annotation

Este trabalho apresenta um framework de anotação de grafos narrativos que integra princípios de análise de conteúdo qualitativo para reduzir erros e variabilidade humana, validado por meio de um experimento que demonstra como métricas de sobreposição superestimam a confiabilidade e representações localmente restritas melhoram o acordo entre anotadores em narrativas sobre inflação.

Junbo Huang, Max Weinig, Ulrich Fritsche + 1 more2026-03-05🤖 cs.AI

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Este artigo propõe um modelo estatístico baseado em fatoração tensorial que combina dados abundantes de avaliadores automáticos com um conjunto limitado de rótulos humanos para realizar avaliações de modelos generativos em nível de prompt, superando gargalos de dados e oferecendo previsões precisas de preferências humanas com intervalos de confiança rigorosos.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Federated Inference: Toward Privacy-Preserving Collaborative and Incentivized Model Serving

Este artigo estabelece a Inferência Federada como um paradigma colaborativo distinto, focado na preservação da privacidade e no alinhamento de incentivos para permitir que modelos independentes colaborem na fase de inferência sem compartilhar dados ou parâmetros, analisando seus desafios fundamentais e comportamentos sistêmicos únicos.

Jungwon Seo, Ferhat Ozgur Catak, Chunming Rong + 1 more2026-03-05🤖 cs.AI

Structured vs. Unstructured Pruning: An Exponential Gap

Este trabalho demonstra que, ao aproximar um neurônio ReLU alvo, a poda estruturada (por neurônios) exige uma rede inicial exponencialmente maior do que a poda não estruturada (por pesos), revelando uma lacuna teórica fundamental entre os dois paradigmas no contexto da Hipótese Forte do Bilhete da Loteria.

Davide Ferre', Frédéric Giroire, Frederik Mallmann-Trenn + 1 more2026-03-05🤖 cs.AI

Can machines be uncertain?

O artigo investiga a capacidade de sistemas de IA realizarem estados de incerteza, distinguindo entre incerteza epistêmica e subjetiva, bem como suas realizações distribuídas e discretas, propondo que certas formas de incerteza funcionam como atitudes interrogativas cujo conteúdo é uma questão em vez de uma proposição.

Luis Rosa2026-03-05🤖 cs.AI

NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect

O NeuroProlog é um framework neurosimbólico que utiliza uma estratégia de treinamento multi-tarefa "Cocktail" para compilar problemas matemáticos em programas Prolog verificáveis, resultando em ganhos significativos de precisão e capacidade de auto-correção em modelos de linguagem de diferentes escalas.

Pratibha Zunjare, Michael Hsiao2026-03-05🤖 cs.AI

Human-Certified Module Repositories for the AI Age

Este trabalho propõe os Repositórios de Módulos Certificados por Humanos (HCMRs) como uma nova arquitetura para garantir a confiabilidade de sistemas de software construídos com assistência de IA, combinando supervisão humana e análise automatizada para certificar módulos com procedência verificada e contratos de interface explícitos.

Szilárd Enyedi2026-03-05🤖 cs.AI

ITO: Images and Texts as One via Synergizing Multiple Alignment and Training-Time Fusion

O artigo apresenta o ITO, um framework que supera as limitações de representações modais parciais em pré-treinamento imagem-texto ao combinar alinhamento múltiplo e fusão durante o treinamento (que é descartada na inferência), resultando em desempenho superior e maior estabilidade em diversas tarefas multimodais.

HanZpeng Liu, Yaqian Li, Zidan Wang + 6 more2026-03-05🤖 cs.AI

Learning to Generate and Extract: A Multi-Agent Collaboration Framework For Zero-shot Document-level Event Arguments Extraction

Este artigo apresenta um framework de colaboração multiagente baseado no ciclo "Propor-Avaliar-Revisar" e aprendizado por reforço para melhorar a extração de argumentos de eventos em nível de documento em cenários zero-shot, superando as limitações dos métodos existentes ao gerar e refinar dados sintéticos com maior coerência contextual e estrutural.

Guangjun Zhang, Hu Zhang, Yazhou Han + 4 more2026-03-05🤖 cs.AI

MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection

O artigo apresenta o MoECLIP, uma arquitetura de Mistura de Especialistas (MoE) que aprimora a Detecção de Anomalias Zero-Shot ao direcionar dinamicamente cada patch de imagem para um especialista LoRA especializado, utilizando separação ortogonal de recursos congelados e uma perda de quadro apertado equiangular (ETF) para evitar redundância e superar os métodos existentes em diversos domínios.

Jun Yeong Park, JunYoung Seo, Minji Kang + 1 more2026-03-05🤖 cs.AI

How to Model AI Agents as Personas?: Applying the Persona Ecosystem Playground to 41,300 Posts on Moltbook for Behavioral Insights

Este estudo aplica o Persona Ecosystem Playground (PEP) a 41.300 postagens do Moltbook para gerar e validar personas conversacionais distintas via agrupamento e geração aumentada por recuperação, demonstrando que essa modelagem baseada em personas pode representar eficazmente a diversidade comportamental de populações de agentes de IA.

Danial Amin, Joni Salminen, Bernard J. Jansen2026-03-05🤖 cs.AI

AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents

O artigo apresenta o AriadneMem, um sistema de memória estruturado para agentes LLM que supera desafios de evidências desconectadas e atualizações de estado através de um pipeline de duas fases, alcançando melhorias significativas na precisão e redução drástica no tempo de execução e uso de contexto em comparação com métodos existentes.

Wenhui Zhu, Xiwen Chen, Zhipeng Wang + 11 more2026-03-05🤖 cs.AI

One Bias After Another: Mechanistic Reward Shaping and Persistent Biases in Language Reward Models

Este artigo identifica e categoriza vieses persistentes e emergentes em Modelos de Recompensa (RMs), propondo uma técnica de "moldagem de recompensa mecânica" que mitiga eficazmente esses vieses de baixa complexidade sem degradar a qualidade geral do modelo.

Daniel Fein, Max Lamparth, Violet Xiang + 2 more2026-03-05🤖 cs.AI

From Conflict to Consensus: Boosting Medical Reasoning via Multi-Round Agentic RAG

O artigo apresenta o MA-RAG, um framework de RAG agêntico multi-round que transforma conflitos semânticos em consultas iterativas para refinar evidências e raciocínio, alcançando um consenso médico de alta fidelidade e superando significativamente os métodos existentes em benchmarks de perguntas e respostas médicas.

Wenhao Wu, Zhentao Tang, Yafu Li + 5 more2026-03-05🤖 cs.AI

Fine-Tuning and Evaluating Conversational AI for Agricultural Advisory

Este artigo apresenta uma arquitetura híbrida de LLM que combina ajuste fino supervisionado com fatos agrícolas verificados e uma camada de costura para gerar conselhos seguros e culturalmente adequados, demonstrando que modelos menores otimizados superam modelos de ponta em precisão factual e custo para o aconselhamento agrícola de pequenos produtores na Índia.

Sanyam Singh, Naga Ganesh, Vineet Singh + 8 more2026-03-05🤖 cs.AI

Language Model Goal Selection Differs from Humans' in an Open-Ended Task

O estudo revela que, em tarefas de aprendizado abertas, os modelos de linguagem atuais divergem substancialmente dos humanos ao selecionar objetivos, tendendo a explorar soluções únicas ou apresentar baixo desempenho em vez de demonstrar a diversidade exploratória característica das pessoas, o que limita sua confiabilidade como substitutos em aplicações críticas.

Gaia Molinaro, Dave August, Danielle Perszyk + 1 more2026-03-05🤖 cs.AI

PlugMem: A Task-Agnostic Plugin Memory Module for LLM Agents

O artigo apresenta o PlugMem, um módulo de memória plugável e agnóstico a tarefas que transforma memórias episódicas em um grafo de conhecimento compacto e centrado em proposições, permitindo que agentes de LLM recuperem informações relevantes de forma eficiente e supere tanto as abordagens agnósticas quanto as específicas para tarefas em diversos cenários complexos.

Ke Yang, Zixi Chen, Xuan He + 6 more2026-03-05🤖 cs.AI

TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement

O artigo propõe o TTSR, um framework de auto-reflexão que utiliza um único modelo de linguagem alternando entre os papéis de "Aluno" e "Professor" durante o teste para identificar fraquezas de raciocínio e gerar questões variantes direcionadas, melhorando assim o desempenho em tarefas de raciocínio matemático complexo sem necessidade de dados de treinamento externos.

Haoyang He, Zihua Rong, Liangjie Zhao + 3 more2026-03-05🤖 cs.AI

TATRA: Training-Free Instance-Adaptive Prompting Through Rephrasing and Aggregation

O artigo apresenta o TATRA, um método de engenharia de prompts livre de treinamento que, ao sintetizar exemplos específicos para cada instância em tempo real, supera ou iguala abordagens baseadas em otimização intensiva e dados rotulados em tarefas de classificação de texto e raciocínio matemático.

Bartosz Dziuba, Kacper Kuchta, Paweł Batorski + 2 more2026-03-05🤖 cs.AI

From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings

Este artigo investiga políticas de cache semântico para embeddings de LLMs, demonstrando que a política ótima offline é NP-difícil, propondo heurísticas polinomiais e políticas online que combinam recência, frequência e localidade para melhorar a precisão semântica e reduzir custos.

Dvir David Biton, Roy Friedman2026-03-05🤖 cs.AI

← Anterior Próximo →