From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Este artigo propõe três abordagens complementares para superar as limitações das ferramentas atuais na documentação de atividades criativas, que frequentemente perdem a estrutura de exploração não linear, a intenção representacional e os limites de interação, ao apresentar interfaces baseadas em nós para gestão de artefatos de IA generativa, um vocabulário de sinais visuais para autoria de visualizações e um modelo de programação que incorpora histórias semânticas diretamente no estado de interação.

Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Este trabalho propõe a Arquitetura de Governança em Camadas (LGA), um framework de quatro níveis que integra sandboxing, verificação de intenção, autorização de confiança zero e auditoria imutável para mitigar vulnerabilidades de execução em agentes autônomos, demonstrando experimentalmente sua eficácia na interceptação de ameaças com baixa latência e alta precisão.

Yuxu Ge2026-03-10💻 cs

Re2\textbf{Re}^{2}: Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

O artigo apresenta o método Re², que utiliza aprendizado por reforço para ensinar modelos de linguagem a abandonar caminhos de raciocínio improdutivos e reiniciar a solução, superando a ineficiência do "overthinking" e alcançando ganhos significativos de desempenho em comparação com o treinamento padrão de RLVR.

Pinzheng Wang, Shuli Xu, Juntao Li, Yu Luo, Dong Li, Jianye Hao, Min Zhang2026-03-10💻 cs

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

Este artigo apresenta uma arquitetura de transformador miniatura inspirada no cérebro que demonstra, através de ablações, que a lateralização funcional dos bancos hipocampais depende criticamente da sinergia entre um buffer de memória de trabalho pré-frontal e acoplamento inibitório, revelando uma transição de fase descontínua onde o contexto de trabalho atua como quebra de simetria necessária para o surgimento da especialização hemisférica.

Hong Jeong2026-03-10💻 cs

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

Este artigo propõe um sistema híbrido de recomendação baseado em *Learning-to-Rank* e incorporação de contexto social, que utiliza técnicas de mineração de texto e aprendizado profundo em dados do Stack Overflow para auxiliar desenvolvedores a encontrar soluções para bugs de software, alcançando uma precisão de aproximadamente 78% ao sugerir as 10 melhores respostas.

Fouzi Harrag, Mokdad Khemliche2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

Este estudo empírico demonstra que, sob diversas restrições de implantação, quatro modelos de linguagem de grande porte (LLMs) apresentam altas taxas de alucinação de citações bibliográficas, com taxas de existência verificável inferiores a 47,5%, o que reforça a necessidade imperativa de validação pós-geração antes de seu uso em síntese de evidências de engenharia de software.

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

O artigo apresenta o MAviS, um assistente conversacional multimodal especializado em aves, composto pelo conjunto de dados MAviS-Dataset, pelo modelo MAviS-Chat e pelo benchmark MAviS-Bench, que juntos superam os modelos de base existentes ao oferecer compreensão detalhada e respostas precisas para mais de 1.000 espécies de aves, integrando áudio, visão e texto para aplicações em conservação da biodiversidade.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

Data-Driven Hints in Intelligent Tutoring Systems

Este capítulo explora a evolução da geração de dicas orientada por dados em sistemas tutores inteligentes, destacando como técnicas como a Fábrica de Dicas e Redes de Interação permitem a criação de sugestões de próximos passos e a identificação do momento ideal para intervenções, além de investigar futuras adaptações baseadas em dados comportamentais e na integração de Modelos de Linguagem de Grande Escala (LLMs).

Sutapa Dey Tithi, Kimia Fazeli, Dmitri Droujkov, Tahreem Yasir, Xiaoyi Tian, Tiffany Barnes2026-03-10💻 cs

FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets

O artigo apresenta o FinSheet-Bench, um benchmark de dados financeiros sintéticos que demonstra que os atuais Grandes Modelos de Linguagem (LLMs) ainda não atingem a precisão necessária para uso não supervisionado em aplicações financeiras profissionais devido a erros significativos em spreadsheets complexos, sugerindo que soluções confiáveis exigirão abordagens arquitetônicas que separem a compreensão de documentos da computação determinística.

Jan Ravnik, Matjaž Ličen, Felix Bührmann, Bithiah Yuan, Felix Stinson, Tanvi Singh2026-03-10💻 cs

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

O artigo apresenta o framework de Transição de Hierarquia de Normas (NHT), que explica como a regularização por peso (weight decay) guia redes neurais a abandonar gradualmente soluções de atalho de alta norma em favor de representações estruturadas de baixa norma, unificando fenômenos como o "grokking" e o aprendizado tardio de características sob um mecanismo comum de travessia hierárquica de normas.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Este artigo propõe uma terceira ambição para a inteligência artificial, posicionando os grandes modelos de linguagem como instrumentos científicos para estudar o comportamento humano, a cultura e o raciocínio moral ao analisar padrões de discurso coletivo, ao mesmo tempo em que delineia métodos metodológicos e advertências epistemológicas sobre o uso desses modelos na pesquisa social.

W. Russell Neuman, Chad Coleman2026-03-10💬 cs.CL