cs.AI artigos | Gist.Science

Theory of Code Space: Do Code Agents Understand Software Architecture?

O artigo apresenta o "Theory of Code Space" (ToCS), um benchmark que avalia a capacidade de agentes de IA de construir e manter crenças arquiteturais coerentes em bases de código, revelando que a eficácia da exploração ativa, o uso de mapas de crenças estruturados e a estabilidade da memória variam significativamente entre diferentes modelos de linguagem.

Grigory Sapunov2026-03-09🤖 cs.AI

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Este trabalho propõe uma decomposição funcional de Anel Tensorial reparametrizada, que utiliza Representações Neurais Implícitas e uma estrutura de base fixa para superar as limitações de dados em malhas e melhorar a recuperação de detalhes de alta frequência em tarefas de reconstrução de dados multidimensionais.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

How Well Does Agent Development Reflect Real-World Work?

Este estudo revela uma discrepância significativa entre o foco atual no desenvolvimento de agentes de IA (centrado em programação) e a distribuição real do trabalho humano e do valor econômico, propondo princípios para criar benchmarks mais representativos e úteis.

Zora Zhiruo Wang, Sanidhya Vijayvargiya, Aspen Chen, Hanmo Zhang, Venu Arvind Arangarajan, Jett Chen, Valerie Chen, Diyi Yang, Daniel Fried, Graham Neubig2026-03-09🤖 cs.AI

Multimodal Mixture-of-Experts with Retrieval Augmentation for Protein Active Site Identification

O artigo apresenta o MERA, um novo framework de identificação de sítios ativos de proteínas que combina um mecanismo de mistura de especialistas com recuperação hierárquica e uma estratégia de fusão baseada na teoria de evidência de Dempster-Shafer para superar desafios de dados esparsos e confiabilidade de modalidades, alcançando desempenho superior ao estado da arte.

Jiayang Wu, Jiale Zhou, Rubo Wang, Xingyi Zhang, Xun Lin, Tianxu Lv, Leong Hou U, Yefeng Zheng2026-03-09🤖 cs.AI

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

Este artigo apresenta o sistema CLEO e um modelo de decisão que permitem a agentes de IA interpretar ações humanas em tempo real em artefatos compartilhados, facilitando a colaboração co-criativa dinâmica ao distinguir entre feedback e trabalho independente.

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho Kim2026-03-09🤖 cs.AI

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

O artigo apresenta o Whisper-RIR-Mega, um novo conjunto de dados de benchmark que emparelha falas limpas do LibriSpeech com suas versões reverberadas usando respostas ao impulso reais, visando avaliar e melhorar a robustez de modelos de reconhecimento automático de fala (ASR) às variações acústicas de ambientes.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

O artigo apresenta o RigidSSL, um framework de pré-treinamento auto-supervisionado que integra aprendizado geométrico baseado em rigidez e dinâmica molecular para superar limitações atuais na geração de proteínas, melhorando significativamente a projetabilidade, a diversidade e a precisão na modelagem de ensembles conformacionais.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

Can LLM Aid in Solving Constraints with Inductive Definitions?

Este artigo propõe uma abordagem neuro-simbólica que integra Grandes Modelos de Linguagem (LLMs) com solucionadores de restrições para gerar lemas auxiliares e verificar conjecturas, demonstrando uma melhoria de cerca de 25% na resolução de tarefas de prova envolvendo definições indutivas em comparação com os solucionadores de última geração.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Este estudo empírico identifica quatro temas centrais — Governança de IA e Autoridade Humana, Refinamento Iterativo com Humano no Loop, Ciclo de Vida do Sistema e Restrições Operacionais, e Colaboração e Coordenação entre Humano e IA — por meio de uma análise qualitativa de um chatbot de suporte ao cliente e entrevistas com especialistas, visando orientar a estruturação de papéis e mecanismos de feedback no desenvolvimento de aplicações de IA.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

O artigo apresenta o "Companion", um sistema artístico que integra um robô de desenho com modelos de linguagem grandes para facilitar uma colaboração criativa bidirecional por meio de fala e esboços, transformando o robô de um executor passivo em um parceiro co-criativo capaz de gerar obras com identidade estética distinta e mérito de exposição profissional.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Este estudo apresenta o ARC, uma ferramenta de pesquisa que, ao integrar múltiplas bases de dados e oferecer IA transparente para triagem, reduz a carga cognitiva dos pesquisadores e transforma o processo de Revisões Sistemáticas da Literatura de uma tarefa administrativa em uma exploração estratégica e verificável.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

O artigo propõe o "Traversal-as-Policy", um método que distila logs de execução em Árvores de Comportamento Portãoizadas (GBTs) executáveis para substituir a geração livre de LLMs por uma política de controle verificável e segura, demonstrando melhorias significativas em taxas de sucesso, redução de violações e eficiência de custos em benchmarks como SWE-bench Verified e WebArena.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

O artigo apresenta o RoboLayout, uma extensão do LayoutVLM que aprimora a geração de layouts de cenas 3D para agentes corporificados ao integrar restrições de alcançabilidade em um processo de otimização diferenciável e incluir uma etapa de refinamento local, permitindo a criação de ambientes semanticamente coerentes e fisicamente viáveis para diversos tipos de agentes.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

Este artigo oferece uma revisão das representações moleculares digitais inspiradas no processamento de linguagem natural (NLP) e de suas aplicações em inteligência artificial para química e ciência dos materiais, servindo como um guia essencial para pesquisadores que buscam atuar na interseção desses campos.

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

O artigo apresenta o Omni-C, um único codificador denso baseado em Transformer que comprime modalidades heterogêneas (imagem, áudio e texto) em representações compartilhadas competitivas através de pré-treinamento contrastivo, eliminando a necessidade de arquiteturas complexas de Mixture-of-Experts e reduzindo significativamente o uso de memória para inferência eficiente.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

Towards Neural Graph Data Management

O artigo apresenta o NGDBench, um benchmark unificado que avalia as capacidades de bancos de dados gráficos neurais em cinco domínios diversos, revelando limitações significativas nos modelos de linguagem atuais ao lidar com a linguagem de consulta Cypher completa e operações complexas de gerenciamento de dados.

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu Song2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Este estudo avalia o modelo de IA Boltz-2 para descoberta de fármacos e conclui que, embora ofereça velocidade para triagem inicial, carece da precisão energética necessária para a identificação de candidatos, exigindo métodos baseados em física para validação e refinamento.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

O artigo propõe o JAWS, uma estratégia de regularização probabilística que ajusta adaptativamente a força da regularização com base na complexidade física local, permitindo que modelos de operadores neurais realizem rollouts de longo prazo estáveis e precisos em sistemas dinâmicos com descontinuidades, superando o dilema entre contração e dissipação e reduzindo os custos computacionais.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

O artigo apresenta o VDCook, um sistema operacional de dados de vídeo autoevolutivo e configurável que permite a pesquisadores e equipes de domínio vertical gerar, atualizar e expandir continuamente conjuntos de dados especializados para MLLMs por meio de consultas em linguagem natural e síntese controlada.

Chengwei Wu2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Este artigo examina os desafios e oportunidades impostos pela rápida evolução da IA na interação humano-dados, destacando a necessidade de redefinir os papéis humanos e de máquina, superar limitações de escalabilidade e incerteza, e integrar princípios cognitivos e de design para construir sistemas analíticos centrados no ser humano na era da inteligência artificial.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

← Anterior Próximo →