cs.AI artigos | Gist.Science

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Este artigo propõe um framework interpretável baseado em conceitos médicos-chave e redes neurais de convolução gráfica (GCN) para classificar imagens de ultrassom fetal, oferecendo explicações alinhadas à cognição clínica que superam as limitações de transparência dos modelos de deep learning tradicionais.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Mean-based incomplete pairwise comparisons method with the reference values

Este artigo propõe dois métodos quantitativos baseados em valores de referência para calcular vetores de peso a partir de matrizes de comparações pareadas incompletas, estendendo as heurísticas aritmética e geométrica, provando a otimalidade e a existência de solução para a versão geométrica e fornecendo condições suficientes para a versão aritmética.

Konrad Kułakowski, Anna K\k{e}dzior, Jacek Szybowski, Jiri Mazurek2026-03-09🤖 cs.AI

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

Este artigo demonstra que, apesar de sua excelência em tarefas de geração, os Grandes Modelos de Linguagem (LLMs) apresentam desempenho significativamente inferior e, por vezes, não confiável em tarefas de avaliação, revelando uma lacuna crítica entre a capacidade de gerar e a de avaliar corretamente.

Juhyun Oh, Eunsu Kim, Inha Cha, Alice Oh2026-03-09💻 cs

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

O artigo apresenta o RAG-Driver, um modelo de linguagem grande multimodal com aprendizado por contexto aumentado por recuperação que utiliza demonstrações de especialistas para gerar explicações de condução e previsões de controle com alto desempenho e generalização zero-shot em ambientes não vistos, superando desafios como escassez de dados e esquecimento catastrófico.

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Este artigo deriva estimativas teóricas de limites inferiores para o consumo energético de otimizadores neuromórficos ideais que utilizam o paradigma de "aprendizado na memória" (LIM), estabelecendo métricas de eficiência energética independentes do modelo que dependem apenas do número de operações, tamanho do modelo, velocidade de convergência e precisão da solução.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Este artigo propõe um novo sistema de detecção de alucinações visuais estruturais em imagens de personagens de desenho animado geradas por modelos Texto-para-Imagem, utilizando um Modelo Visão-Linguagem aprimorado por aprendizado em contexto com orientação de pose (PA-ICVL), que demonstra melhorias significativas de desempenho em comparação com métodos baseados apenas em imagens RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

Algorithmic Collusion by Large Language Models

Este estudo demonstra que agentes de precificação baseados em Grandes Modelos de Linguagem (LLMs) alcançam autonomamente preços e lucros supracompetitivos em cenários de oligopólio, sendo essa tendência sensível a variações sutis nos prompts e representando desafios significativos para a futura regulação de agentes de precificação por IA.

Sara Fish, Yannai A. Gonczarowski, Ran I. Shorrer2026-03-09🤖 cs.AI

Computational lexical analysis of Flamenco genres

Este estudo aplica análise computacional e aprendizado de máquina a mais de 2000 letras de flamenco para classificar automaticamente os gêneros musicais (*palos*), identificar seus campos semânticos característicos e revelar conexões históricas e evoluções estilísticas através de uma análise de rede baseada na distância intergêneros.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artigo apresenta um pipeline inovador de aprendizado ativo em duas etapas para reconhecimento automático de fala, que combina agrupamento de x-vectors e inferência bayesiana via dropout Monte Carlo para selecionar amostras diversificadas e informativas, otimizando significativamente o esforço de rotulagem e o desempenho do modelo.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

My part is bigger than yours -- assessment within a group of peers

Este artigo apresenta modelos simples para agregar as avaliações de contribuições de pares em projetos colaborativos, vinculando o peso da opinião de cada especialista à magnitude de sua própria contribuição, a fim de estabelecer um consenso justo sobre a divisão de recompensas.

Konrad Kułakowski, Jacek Szybowski2026-03-09🤖 cs.AI

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabalho oferece uma revisão abrangente e uma especificação formal detalhada das Redes de Codificação Preditiva (PCNs), situando-as no contexto dos métodos modernos de aprendizado de máquina e destacando seu potencial como uma estrutura versátil e biologicamente plausível para futuras inovações em IA.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

Transforming Agency. On the mode of existence of Large Language Models

O artigo investiga a ontologia dos Grandes Modelos de Linguagem (LLMs), concluindo que, embora faltem às condições necessárias para a agência autônoma segundo teorias corporificadas da mente, eles atuam como interlocutores linguísticos que, ao se acoplar com humanos, transformam e produzem novas formas de agência intencional.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

O FALCON é um método de pré-treinamento auto-supervisionado para reconhecimento de ações em vídeos de UAVs que supera o desequilíbrio espacial típico de imagens aéreas ao integrar um autoencoder mascarado consciente de objetos com reconstrução futura de duplo horizonte, resultando em maior precisão e inferência significativamente mais rápida em comparação com abordagens supervisionadas.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

O artigo apresenta o UniHR, um framework de aprendizado de representação hierárquica unificada que integra dados de diferentes tipos de grafos de conhecimento (hiper-relacionais, temporais e aninhados) em representações baseadas em triplas para melhorar a previsão de links em cenários complexos do mundo real.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

O artigo apresenta o SpecEM, um framework de ensemble de modelos de linguagem grandes (LLMs) sem treinamento que combina previsão de segmentos futuros e um mecanismo de feedback online para ajustar dinamicamente os pesos dos modelos, superando as limitações de latência e colaboração semântica dos métodos existentes.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta pesquisa oferece uma visão geral estruturada sobre como os modelos de linguagem multimodais estão transformando o ciclo de vida científico, abrangendo desde a descoberta e experimentação até a geração de conteúdo e avaliação, ao mesmo tempo que discute técnicas, tendências, desafios éticos e o potencial de integração em futuros sistemas de "IA para Ciência".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Este artigo propõe e avalia uma metodologia para fine-tuning de LLMs na geração de texto code-switched (português-inglês), demonstrando que essa abordagem produz resultados fluentes e de alta qualidade, enquanto destaca que métricas tradicionais falham em correlacionar-se com o julgamento humano, ao contrário de avaliações baseadas em LLMs.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Este artigo apresenta o Controle Preditivo Generativo, um novo quadro de aprendizado supervisionado que utiliza políticas de correspondência de fluxo para resolver tarefas robóticas dinâmicas e de difícil demonstração, superando as limitações de métodos existentes ao permitir o uso de simulações e garantir feedback de alta frequência.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

O artigo apresenta o FragFM, uma nova estrutura hierárquica baseada em correspondência de fluxo discreto em nível de fragmentos que permite a geração eficiente e escalável de moléculas com melhor controle de propriedades, além de propor o benchmark NPGen para avaliar a capacidade de modelos generativos de criar moléculas semelhantes a produtos naturais.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

← Anterior Próximo →