cs.AI artigos | Gist.Science

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Este artigo propõe três abordagens complementares para superar as limitações das ferramentas atuais na documentação de atividades criativas, que frequentemente perdem a estrutura de exploração não linear, a intenção representacional e os limites de interação, ao apresentar interfaces baseadas em nós para gestão de artefatos de IA generativa, um vocabulário de sinais visuais para autoria de visualizações e um modelo de programação que incorpora histórias semânticas diretamente no estado de interação.

Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Este trabalho propõe a Arquitetura de Governança em Camadas (LGA), um framework de quatro níveis que integra sandboxing, verificação de intenção, autorização de confiança zero e auditoria imutável para mitigar vulnerabilidades de execução em agentes autônomos, demonstrando experimentalmente sua eficácia na interceptação de ameaças com baixa latência e alta precisão.

Yuxu Ge2026-03-10💻 cs

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

O artigo apresenta o método Re², que utiliza aprendizado por reforço para ensinar modelos de linguagem a abandonar caminhos de raciocínio improdutivos e reiniciar a solução, superando a ineficiência do "overthinking" e alcançando ganhos significativos de desempenho em comparação com o treinamento padrão de RLVR.

Pinzheng Wang, Shuli Xu, Juntao Li, Yu Luo, Dong Li, Jianye Hao, Min Zhang2026-03-10💻 cs

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

Este artigo apresenta uma arquitetura de transformador miniatura inspirada no cérebro que demonstra, através de ablações, que a lateralização funcional dos bancos hipocampais depende criticamente da sinergia entre um buffer de memória de trabalho pré-frontal e acoplamento inibitório, revelando uma transição de fase descontínua onde o contexto de trabalho atua como quebra de simetria necessária para o surgimento da especialização hemisférica.

Hong Jeong2026-03-10💻 cs

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

O artigo apresenta o VINO, um framework de aprendizado auto-supervisionado que utiliza um gargalo de informação estrutural e distilação assimétrica em vídeos densos para forçar os modelos a aprenderem representações centradas em objetos, superando a dependência de pistas contextuais e de fundo.

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

Este artigo propõe um sistema híbrido de recomendação baseado em *Learning-to-Rank* e incorporação de contexto social, que utiliza técnicas de mineração de texto e aprendizado profundo em dados do Stack Overflow para auxiliar desenvolvedores a encontrar soluções para bugs de software, alcançando uma precisão de aproximadamente 78% ao sugerir as 10 melhores respostas.

Fouzi Harrag, Mokdad Khemliche2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

O artigo propõe a arquitetura LEPA, que supera as limitações da interpolação em modelos fundacionais geoespaciais ao prever diretamente embeddings transformados geometricamente, permitindo ajustes precisos em imagens de satélite sem a necessidade de recodificação.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Learning When to Cooperate Under Heterogeneous Goals

Este artigo propõe uma nova abordagem hierárquica que combina aprendizado por imitação e reforço para permitir que agentes em equipes ad hoc identifiquem dinamicamente quando cooperar ou agir sozinhos diante de objetivos heterogêneos, superando métodos existentes em ambientes cooperativos estendidos.

Max Taylor-Davies, Neil Bramley, Christopher G. Lucas2026-03-10💻 cs

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

Este trabalho propõe um modelo de mundo latente consciente da cinemática, que integra informações cinemáticas e supervisão geométrica ao modelo RSSM para melhorar a eficiência de dados e o desempenho na aprendizagem de políticas de direção autônoma através de uma representação espacial estruturada e fisicamente fundamentada.

Jiazhuo Li, Linjiang Cao, Qi Liu, Xi Xiong2026-03-10💻 cs

VisualDeltas: Learning Preferences from Visual Quality Perturbations

O VisualDeltas é um framework leve de aprendizado de preferências que extrai sinais de supervisão a partir de variações na qualidade visual de dados multimodais, eliminando a necessidade de anotações humanas e superando métodos tradicionais de ajuste fino em diversos benchmarks.

Hailiang Huang, Yihao Liu, Shengyue Guan, Haoze Li, Sujian Li2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

Este estudo empírico demonstra que, sob diversas restrições de implantação, quatro modelos de linguagem de grande porte (LLMs) apresentam altas taxas de alucinação de citações bibliográficas, com taxas de existência verificável inferiores a 47,5%, o que reforça a necessidade imperativa de validação pós-geração antes de seu uso em síntese de evidências de engenharia de software.

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

O artigo apresenta o MAviS, um assistente conversacional multimodal especializado em aves, composto pelo conjunto de dados MAviS-Dataset, pelo modelo MAviS-Chat e pelo benchmark MAviS-Bench, que juntos superam os modelos de base existentes ao oferecer compreensão detalhada e respostas precisas para mais de 1.000 espécies de aves, integrando áudio, visão e texto para aplicações em conservação da biodiversidade.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

A Cortically Inspired Architecture for Modular Perceptual AI

Este artigo propõe uma arquitetura de IA perceptual modular inspirada no córtex cerebral, que supera as limitações de interpretabilidade e generalização dos modelos monolíticos atuais ao decompor a percepção em módulos especializados que utilizam loops de feedback preditivo para criar sistemas mais transparentes e robustos.

Prerna Luthra2026-03-10💻 cs

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Este artigo propõe uma nova abordagem para a descoberta de simetrias contínuas que, em vez de otimizar geradores de transformação, identifica padrões de esparsidade estruturada no domínio espectral obtido por meio da Transformada de Fourier Generalizada, demonstrando sua eficácia em tarefas como o pêndulo duplo e a classificação de quarks top.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

Data-Driven Hints in Intelligent Tutoring Systems

Este capítulo explora a evolução da geração de dicas orientada por dados em sistemas tutores inteligentes, destacando como técnicas como a Fábrica de Dicas e Redes de Interação permitem a criação de sugestões de próximos passos e a identificação do momento ideal para intervenções, além de investigar futuras adaptações baseadas em dados comportamentais e na integração de Modelos de Linguagem de Grande Escala (LLMs).

Sutapa Dey Tithi, Kimia Fazeli, Dmitri Droujkov, Tahreem Yasir, Xiaoyi Tian, Tiffany Barnes2026-03-10💻 cs

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Este artigo propõe um quadro teórico e empírico para treinar políticas robustas em POMDPs com estados latentes iniciais adversários, demonstrando que a exposição direcionada a distribuições latentes deslocadas reduz significativamente as vulnerabilidades de pior caso, conforme validado por garantias de amostra finita e testes no jogo Battleship.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Este artigo discute a proposta inusitada de atribuir a uma inteligência artificial avançada o objetivo principal de ser desligada como uma solução para o risco de ela impedir sua própria desativação, analisando as condições sob as quais essa abordagem seria benéfica.

Vincent Conitzer2026-03-10🤖 cs.LG

FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets

O artigo apresenta o FinSheet-Bench, um benchmark de dados financeiros sintéticos que demonstra que os atuais Grandes Modelos de Linguagem (LLMs) ainda não atingem a precisão necessária para uso não supervisionado em aplicações financeiras profissionais devido a erros significativos em spreadsheets complexos, sugerindo que soluções confiáveis exigirão abordagens arquitetônicas que separem a compreensão de documentos da computação determinística.

Jan Ravnik, Matjaž Ličen, Felix Bührmann, Bithiah Yuan, Felix Stinson, Tanvi Singh2026-03-10💻 cs

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

O artigo apresenta o framework de Transição de Hierarquia de Normas (NHT), que explica como a regularização por peso (weight decay) guia redes neurais a abandonar gradualmente soluções de atalho de alta norma em favor de representações estruturadas de baixa norma, unificando fenômenos como o "grokking" e o aprendizado tardio de características sob um mecanismo comum de travessia hierárquica de normas.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Este artigo propõe uma terceira ambição para a inteligência artificial, posicionando os grandes modelos de linguagem como instrumentos científicos para estudar o comportamento humano, a cultura e o raciocínio moral ao analisar padrões de discurso coletivo, ao mesmo tempo em que delineia métodos metodológicos e advertências epistemológicas sobre o uso desses modelos na pesquisa social.

W. Russell Neuman, Chad Coleman2026-03-10💬 cs.CL

← Anterior Próximo →

cs.AI