cs.AI artigos | Gist.Science

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Este artigo deriva estimativas teóricas de limites inferiores para o consumo energético de otimizadores neuromórficos ideais que utilizam o paradigma de "aprendizado na memória" (LIM), estabelecendo métricas de eficiência energética independentes do modelo que dependem apenas do número de operações, tamanho do modelo, velocidade de convergência e precisão da solução.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Este artigo propõe um novo sistema de detecção de alucinações visuais estruturais em imagens de personagens de desenho animado geradas por modelos Texto-para-Imagem, utilizando um Modelo Visão-Linguagem aprimorado por aprendizado em contexto com orientação de pose (PA-ICVL), que demonstra melhorias significativas de desempenho em comparação com métodos baseados apenas em imagens RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

Algorithmic Collusion by Large Language Models

Este estudo demonstra que agentes de precificação baseados em Grandes Modelos de Linguagem (LLMs) alcançam autonomamente preços e lucros supracompetitivos em cenários de oligopólio, sendo essa tendência sensível a variações sutis nos prompts e representando desafios significativos para a futura regulação de agentes de precificação por IA.

Sara Fish, Yannai A. Gonczarowski, Ran I. Shorrer2026-03-09🤖 cs.AI

Computational lexical analysis of Flamenco genres

Este estudo aplica análise computacional e aprendizado de máquina a mais de 2000 letras de flamenco para classificar automaticamente os gêneros musicais (*palos*), identificar seus campos semânticos característicos e revelar conexões históricas e evoluções estilísticas através de uma análise de rede baseada na distância intergêneros.

Pablo Rosillo-Rodes, Maxi San Miguel, David Sanchez2026-03-09💬 cs.CL

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artigo apresenta um pipeline inovador de aprendizado ativo em duas etapas para reconhecimento automático de fala, que combina agrupamento de x-vectors e inferência bayesiana via dropout Monte Carlo para selecionar amostras diversificadas e informativas, otimizando significativamente o esforço de rotulagem e o desempenho do modelo.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

My part is bigger than yours -- assessment within a group of peers

Este artigo apresenta modelos simples para agregar as avaliações de contribuições de pares em projetos colaborativos, vinculando o peso da opinião de cada especialista à magnitude de sua própria contribuição, a fim de estabelecer um consenso justo sobre a divisão de recompensas.

Konrad Kułakowski, Jacek Szybowski2026-03-09🤖 cs.AI

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabalho oferece uma revisão abrangente e uma especificação formal detalhada das Redes de Codificação Preditiva (PCNs), situando-as no contexto dos métodos modernos de aprendizado de máquina e destacando seu potencial como uma estrutura versátil e biologicamente plausível para futuras inovações em IA.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

Transforming Agency. On the mode of existence of Large Language Models

O artigo investiga a ontologia dos Grandes Modelos de Linguagem (LLMs), concluindo que, embora faltem às condições necessárias para a agência autônoma segundo teorias corporificadas da mente, eles atuam como interlocutores linguísticos que, ao se acoplar com humanos, transformam e produzem novas formas de agência intencional.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

O FALCON é um método de pré-treinamento auto-supervisionado para reconhecimento de ações em vídeos de UAVs que supera o desequilíbrio espacial típico de imagens aéreas ao integrar um autoencoder mascarado consciente de objetos com reconstrução futura de duplo horizonte, resultando em maior precisão e inferência significativamente mais rápida em comparação com abordagens supervisionadas.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction

O artigo apresenta o UniHR, um framework de aprendizado de representação hierárquica unificada que integra dados de diferentes tipos de grafos de conhecimento (hiper-relacionais, temporais e aninhados) em representações baseadas em triplas para melhorar a previsão de links em cenários complexos do mundo real.

Zhiqiang Liu, Yin Hua, Mingyang Chen + 4 more2026-03-09💬 cs.CL

SpecFuse: Ensembling Large Language Models via Next-Segment Prediction

O artigo apresenta o SpecEM, um framework de ensemble de modelos de linguagem grandes (LLMs) sem treinamento que combina previsão de segmentos futuros e um mecanismo de feedback online para ajustar dinamicamente os pesos dos modelos, superando as limitações de latência e colaboração semântica dos métodos existentes.

Bo Lv, Nayu Liu, Chen Tang, Xin Liu, Yue Yu, Ping Luo2026-03-09🤖 cs.AI

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Esta pesquisa oferece uma visão geral estruturada sobre como os modelos de linguagem multimodais estão transformando o ciclo de vida científico, abrangendo desde a descoberta e experimentação até a geração de conteúdo e avaliação, ao mesmo tempo que discute técnicas, tendências, desafios éticos e o potencial de integração em futuros sistemas de "IA para Ciência".

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Conditioning LLMs to Generate Code-Switched Text

Este artigo propõe e avalia uma metodologia para fine-tuning de LLMs na geração de texto code-switched (português-inglês), demonstrando que essa abordagem produz resultados fluentes e de alta qualidade, enquanto destaca que métricas tradicionais falham em correlacionar-se com o julgamento humano, ao contrário de avaliações baseadas em LLMs.

Maite Heredia, Gorka Labaka, Jeremy Barnes, Aitor Soroa2026-03-09🤖 cs.AI

Generative Predictive Control: Flow Matching Policies for Dynamic and Difficult-to-Demonstrate Tasks

Este artigo apresenta o Controle Preditivo Generativo, um novo quadro de aprendizado supervisionado que utiliza políticas de correspondência de fluxo para resolver tarefas robóticas dinâmicas e de difícil demonstração, superando as limitações de métodos existentes ao permitir o uso de simulações e garantir feedback de alta frequência.

Vince Kurtz, Joel W. Burdick2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

O artigo apresenta o FragFM, uma nova estrutura hierárquica baseada em correspondência de fluxo discreto em nível de fragmentos que permite a geração eficiente e escalável de moléculas com melhor controle de propriedades, além de propor o benchmark NPGen para avaliar a capacidade de modelos generativos de criar moléculas semelhantes a produtos naturais.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

O artigo apresenta o SysDPO, um framework que alinha sistemas de IA compostos com preferências humanas ao modelá-los como grafos acíclicos direcionados e estender a Otimização Direta de Preferências (DPO) para superar desafios como interações não diferenciáveis e a dificuldade de traduzir preferências de nível de sistema para componentes individuais.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

Adversarial Robustness of Partitioned Quantum Classifiers

Este artigo investiga a robustez adversarial de classificadores quânticos particionados, demonstrando que perturbações direcionadas a técnicas de divisão de circuitos ou teletransporte equivalem à implementação de portas adversariais em camadas intermediárias, analisando esse fenômeno tanto teoricamente quanto experimentalmente.

Pouya Kananian, Hans-Arno Jacobsen2026-03-09⚛️ quant-ph

A Survey on Music Generation from Single-Modal, Cross-Modal, and Multi-Modal Perspectives

Este artigo revisa o campo emergente da geração de música multimodal, categorizando os sistemas com base nas modalidades, discutindo representações, alinhamento de dados, conjuntos de dados e métodos de avaliação atuais, além de identificar desafios e propor direções futuras para pesquisa.

Shuyu Li, Shulei Ji, Zihao Wang + 3 more2026-03-09🤖 cs.AI

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

O artigo apresenta o FindAnything, um framework de mapeamento em mundo aberto que integra informações visuais e linguísticas em submapas volumétricos centrados em objetos, permitindo uma compreensão semântica escalável e eficiente em termos de memória e tempo para exploração robótica em ambientes desconhecidos.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Este estudo controlado demonstra que, embora modelos de linguagem pré-treinados (LLMs) apresentem potencial para previsão de séries temporais, sua eficácia real é frequentemente mascarada por viés de pequenos conjuntos de dados e, em avaliações rigorosas, eles não superam consistentemente modelos especializados treinados em grandes volumes de dados temporais.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

← Anterior Próximo →