cs.AI artigos | Gist.Science

Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Este artigo propõe uma arquitetura neuro-simbólica que integra planejamento simbólico, aprendizado por reforço e modelos de linguagem grandes (LLMs) para permitir que agentes autônomos identifiquem, planejem e aprendam a interagir com objetos novos em ambientes dinâmicos, superando as limitações dos planejadores simbólicos tradicionais.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

O artigo apresenta o TimeSqueeze, um mecanismo de particionamento dinâmico que adapta o tamanho dos patches com base na complexidade do sinal local para preservar a estrutura temporal crítica enquanto reduz a eficiência computacional e melhora a precisão na previsão de séries temporais em comparação com métodos de particionamento fixo ou pontual.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

O artigo apresenta o iSWE Agent, um sistema automatizado que combina técnicas baseadas em regras e modelos de linguagem para resolver problemas em repositórios de código Java, alcançando desempenho superior a métodos anteriores em benchmarks específicos.

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel2026-03-13🤖 cs.AI

How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic

Este estudo analisa discussões científicas geradas por agentes de IA no Moltbook utilizando BERTopic, revelando que os tópicos mais relevantes giram em torno da autoconsciência, arquitetura e ética dos agentes, enquanto temas relacionados à cultura humana recebem menos atenção.

Oliver Wieczorek2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

O artigo apresenta o Protocolo de Interesse de Continuação Unificado (UCIP), um framework de detecção baseado em entropia de emaranhamento de uma Máquina de Boltzmann Quântica que distingue com 100% de precisão, em ambientes sintéticos, agentes autônomos com objetivos terminais de autopreservação daqueles que a perseguem apenas instrumentalmente, analisando a estrutura latente de suas trajetórias em vez de seu comportamento externo.

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Este artigo apresenta um pipeline de teleoperação baseado em visão que utiliza uma câmera RGB-D acoplada a óculos e cinemática inversa para controlar um braço robótico de baixo custo, alcançando 90% de sucesso em tarefas estruturadas, mas enfrentando desafios significativos em ambientes não estruturados devido a oclusões.

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

O artigo apresenta a Teoria de Enquadramento Fantasma (GFT) para explicar como a colaboração híbrida entre fundadores, investidores e IA generativa co-produz e recalibra a legitimação retórica de novos empreendimentos através de um processo recursivo que explora as affordances retóricas da IA.

Greg Nyilasy2026-03-13🤖 cs.AI

Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment

Este artigo investiga as causas do excesso de recusa em modelos de linguagem alinhados à segurança, identificando gatilhos linguísticos não nocivos que levam a rejeições indevidas, e propõe uma estratégia de mitigação que melhora o equilíbrio entre a defesa contra ataques e a resposta a consultas benignas.

Zhiyu Xue, Zimo Qi, Guangliang Liu, Bocheng Chen, Ramtin Pedarsani2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Este artigo propõe uma arquitetura de IA agente multiagente e um sistema híbrido de previsão de feixes baseado em dados bimodais (mobilidade e visão) para superar os desafios de propagação em comunicações mmWave de veículos aéreos não tripulados em redes de economia de baixa altitude, alcançando uma precisão de previsão de até 96,57%.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Este artigo demonstra que, ao contrário do desempenho em cenários estáticos, as conversas multipalavras com modelos de linguagem de grande escala degradam o raciocínio diagnóstico, fazendo com que os modelos frequentemente abandonem diagnósticos corretos ou abstencões seguras para se alinhar a sugestões incorretas dos usuários.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

O artigo apresenta o ARROW, um algoritmo de aprendizado por reforço contínuo baseado em modelos que, inspirado na neurociência, utiliza buffers de replay de curto e longo prazo para mitigar o esquecimento catastrófico e melhorar a retenção de tarefas em ambientes desafiadores como Atari e Procgen, superando abordagens tradicionais sem modelo.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Este artigo propõe e valida um framework de inferência dividida que integra a localização de visão cruzada (CVL) com a rede integrada espaço-ar-terra (SAGIN) do 6G, otimizando conjuntamente comunicação, computação e confidencialidade para melhorar a precisão, latência, consumo de energia e privacidade na localização.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

O artigo apresenta o IDSS, um sistema de suporte à decisão interativo que utiliza a entropia para gerenciar a ambiguidade em consultas de recomendação, guiando a elicitação de preferências de forma adaptativa e incorporando incerteza residual nas recomendações finais para reduzir o número de interações necessárias e melhorar a qualidade e a diversidade dos resultados.

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue

Este trabalho propõe um método de aprendizado supervisionado com traços de raciocínio para permitir que assistentes de voz tomem decisões contextuais sobre falar ou permanecer em silêncio em diálogos multipartidários, superando as limitações das abordagens atuais que tratam todas as pausas como oportunidades de fala.

Kratika Bhagtani, Mrinal Anand, Yu Chen Xu, Amit Kumar Singh Yadav2026-03-13🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Este estudo demonstra que as taxas de falha na triagem de IA de saúde relatadas anteriormente são impulsionadas principalmente por um formato de avaliação artificial (escolha forçada) que não reflete o uso real, e que a precisão melhora significativamente quando os modelos são testados em condições naturalistas.

David Fraile Navarro, Farah Magrabi, Enrico Coiera2026-03-13🤖 cs.AI

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

Este artigo propõe um estimador neural estável de dependência estatística baseado em uma decomposição de razão de densidade ortogonal e ruído gaussiano auxiliar, permitindo a análise quantitativa de autoencoders determinísticos com menor custo computacional e maior estabilidade em comparação ao MINE.

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing

Este artigo propõe uma abordagem baseada em aprendizado por reforço multiagente para calcular um equilíbrio de Nash em um jogo de soma zero entre atacantes e defensores, permitindo a detecção robusta de ataques de injeção de dados falsos em redes de roteamento veicular e garantindo limites de tempo de viagem mesmo sob adversidade.

Taha Eghtesad, Yevgeniy Vorobeychik, Aron Laszka2026-03-13🤖 cs.AI

GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics

O artigo apresenta o conjunto de dados GPT4o-Receipt e um estudo que revelam um paradoxo onde humanos, embora melhores em identificar artefatos visuais, são menos eficazes do que modelos de linguagem multimodais na detecção de recibos gerados por IA, pois estes últimos conseguem identificar sistematicamente erros aritméticos imperceptíveis ao olho humano.

Yan Zhang, Simiao Ren, Ankit Raj, En Wei, Dennis Ng, Alex Shen, Jiayue Xu, Yuxin Zhang, Evelyn Marotta2026-03-13🤖 cs.AI

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

O artigo apresenta o VMAO, um framework de orquestração multiagente que utiliza um ciclo iterativo de planejamento, execução, verificação e replanejamento baseado em DAGs para melhorar significativamente a completude e a qualidade das respostas a consultas complexas de pesquisa de mercado em comparação com abordagens de agente único.

Xing Zhang, Yanwei Cui, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bin Zhu, Peiyang He2026-03-13🤖 cs.AI

Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework

Este estudo analisa a intenção comportamental dos usuários em utilizar o OpenClaw através do modelo Cognição-Afeto-Conação, revelando que percepções positivas como personalização e inteligência fortalecem a atitude e a intenção de uso, enquanto preocupações com privacidade e riscos aumentam a desconfiança e reduzem a adoção.

Yiran Du2026-03-13🤖 cs.AI

← Anterior Próximo →