cs.AI artigos | Gist.Science

Telogenesis: Goal Is All U Need

O artigo "Telogenesis" propõe e valida um sistema de atenção endógena que gera prioridades adaptativas a partir de lacunas epistêmicas (ignorância, surpresa e obsolescência), demonstrando que tais mecanismos, sem recompensas externas, superam estratégias fixas e recuperam a estrutura latente do ambiente.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

O GenePlan é um novo framework que utiliza algoritmos evolutivos assistidos por modelos de linguagem de grande escala para gerar planejadores generalizados em Python, alcançando desempenho comparável aos planejadores de última geração e superando significativamente outras abordagens baseadas em LLMs em tarefas de planejamento clássico PDDL.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Este artigo propõe que a interação entre o raciocínio humano e a inteligência artificial generativa cria uma "Terceira Entidade" emergente, caracterizada pela "criação de vibe" como automação do conhecimento tácito e por uma emergência assimétrica, desafiando paradigmas epistemológicos e educacionais tradicionais.

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Este artigo apresenta os Fluxos Normalizadores Condicionados Temporalmente (tcNF), uma nova estrutura para detecção de anomalias em séries temporais multivariadas que modela com precisão as dependências temporais e a incerteza ao condicionar o fluxo a observações anteriores, demonstrando robustez e precisão superiores em comparação com métodos existentes.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

O artigo propõe o EvoPrompt, um novo framework que utiliza um projetor de prompts compartilhado entre modalidades e uma estratégia evolutiva de treinamento para adaptar modelos visão-linguagem a tarefas com poucos dados sem esquecer o conhecimento pré-treinado, alcançando desempenho state-of-the-art em aprendizado com poucos exemplos enquanto preserva as capacidades zero-shot originais.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

O artigo apresenta o EDA, um framework eficiente em parâmetros e dados que adapta modelos de rascunho para modelos-alvo ajustados a domínios específicos, restaurando o desempenho da decodificação especulativa com custos de treinamento reduzidos através de uma arquitetura desacoplada, regeneração de dados e seleção de amostras.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Este estudo propõe uma metodologia inovadora que utiliza Grandes Modelos de Linguagem (LLMs) para adaptar mensagens de desmentido de fake news aos traços de personalidade do Big Five, demonstrando que a personalização aumenta a persuasão e oferecendo uma avaliação automatizada que levanta questões éticas sobre o uso dessa tecnologia.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Este artigo demonstra que o algoritmo de dualidade do espaço de estados do Mamba-2 pode ser implementado inteiramente usando primitivas padrão do XLA, eliminando a dependência de kernels CUDA personalizados e permitindo uma inferência autônoma com cache $O(1)$ que funciona de forma idêntica em CPUs, GPUs NVIDIA e TPUs a partir de uma única fonte JAX.

Cosmo Santoni2026-03-11🤖 cs.AI

Routing without Forgetting

O artigo apresenta o "Routing without Forgetting" (RwF), uma arquitetura de transformador que utiliza camadas de recuperação associativa baseada em energia para realizar o aprendizado contínuo online sem esquecer, gerando prompts dinâmicos via recuperação associativa de um único passo em vez de depender de otimização iterativa baseada em gradiente.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

A Variational Latent Equilibrium for Learning in Cortex

Este trabalho propõe um formalismo geral e biologicamente plausível que aproxima o algoritmo de retropropagação no tempo (BPTT) em redes neurais contínuas, unificando princípios de conservação de energia e ação extrema para derivar dinâmicas locais de erro e estender o modelo de Equilíbrio Latente Generalizado (GLE).

Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici2026-03-11🤖 cs.AI

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Este artigo propõe a "engenharia de contexto" como uma disciplina fundamental que, juntamente com a engenharia de intenções e especificações, forma um modelo de maturidade em pirâmide para superar as limitações da engenharia de prompts e permitir a implantação escalável e segura de sistemas multiagentes corporativos.

Vera V. Vishnyakova2026-03-11🤖 cs.AI

Grounding Synthetic Data Generation With Vision and Language Models

Este trabalho propõe um framework fundamentado em visão e linguagem para a geração e avaliação interpretável de dados sintéticos em sensoriamento remoto, introduzindo o conjunto de dados ARAS400k e demonstrando que o treinamento com dados aumentados (reais e sintéticos) supera consistentemente as bases de dados reais em tarefas de segmentação semântica e legendagem de imagens.

Ümit Mert Ça\u{g}lar, Alptekin Temizel2026-03-11🤖 cs.AI

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

O PRECEPT é uma estrutura unificada para adaptação em tempo de teste que combina recuperação determinística de regras, memória consciente de conflitos e evolução de prompts guiada por Pareto para superar a degradação de recuperação, melhorar a generalização composicional e garantir robustez contra conhecimento desatualizado ou adversário em agentes LLM.

Arash Shahmansoori2026-03-11🤖 cs.AI

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

O artigo propõe o benchmark MM-tau-p $^2$ , que introduz 12 novas métricas para avaliar de forma holística e robusta a adaptação de personalidade e a resiliência multimodal de agentes LLM em cenários de controle dual, preenchendo lacunas nas avaliações atuais focadas apenas em chat textual.

Anupam Purwar, Aditya Choudhary2026-03-11🤖 cs.AI

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

O artigo apresenta o MiniAppBench, o primeiro benchmark abrangente para avaliar a geração de miniaplicativos interativos orientados por princípios, e o MiniAppEval, um framework de avaliação baseado em agentes que supera as limitações dos métodos existentes ao medir a qualidade dessas aplicações dinâmicas com alta concordância com o julgamento humano.

Zuhao Zhang, Chengyue Yu, Yuante Li, Chenyi Zhuang, Linjian Mo, Shuai Li2026-03-11🤖 cs.AI

When to Lock Attention: Training-Free KV Control in Video Diffusion

O artigo apresenta o KV-Lock, uma abordagem livre de treinamento para modelos de difusão de vídeo baseados em DiT que otimiza a consistência de fundo e a qualidade do primeiro plano ajustando dinamicamente a fusão de chaves-valor (KVs) e a escala de orientação condicional (CFG) com base na detecção de alucinação.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian Wang2026-03-11🤖 cs.AI

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Este trabalho apresenta um framework de código aberto para detecção de anomalias em séries temporais usando Redes Neurais em Grafos (GNNs), que não só demonstra melhor desempenho e interpretabilidade em comparação com modelos de base, mas também oferece uma avaliação crítica das práticas atuais de métricas e thresholding no campo.

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

Logics-Parsing-Omni Technical Report

Este artigo apresenta o framework Omni Parsing, que estabelece uma taxonomia unificada e um paradigma de análise progressiva para converter dados multimodais não estruturados em conhecimento estruturado e rastreável, validado pelo modelo Logics-Parsing-Omni e pelo benchmark OmniParsingBench.

Xin An, Jingyi Cai, Xiangyang Chen, Huayao Liu, Peiting Liu, Peng Wang, Bei Yang, Xiuwen Zhu, Yongfan Chen, Baoyu Hou, Shuzhao Li, Weidong Ren, Fan Yang, Jiangtao Zhang, Xiaoxiao Xu, Lin Qu2026-03-11🤖 cs.AI

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

O artigo apresenta o EsoLang-Bench, um novo benchmark que utiliza linguagens de programação esotéricas para avaliar o raciocínio genuíno de modelos de linguagem, revelando que, apesar de seu alto desempenho em tarefas de codificação convencionais, eles falham drasticamente ao aprender novas linguagens a partir de documentação, indicando que seus resultados anteriores derivam mais de memorização do que de capacidade de raciocínio transferível.

Aman Sharma, Paras Chopra2026-03-11🤖 cs.AI

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Este estudo apresenta um framework de classificação automatizada para o gerenciamento de risco cardiovascular em idosos, demonstrando que uma arquitetura Transformer personalizada supera tanto métodos tradicionais quanto modelos de linguagem generativos ao analisar registros de saúde eletrônicos não estruturados de longo contexto.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van Es2026-03-11🤖 cs.AI

← Anterior Próximo →

cs.AI