Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Este artigo propõe uma arquitetura neuro-simbólica que integra planejamento simbólico, aprendizado por reforço e modelos de linguagem grandes (LLMs) para permitir que agentes autônomos identifiquem, planejem e aprendam a interagir com objetos novos em ambientes dinâmicos, superando as limitações dos planejadores simbólicos tradicionais.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

O artigo apresenta o TimeSqueeze, um mecanismo de particionamento dinâmico que adapta o tamanho dos patches com base na complexidade do sinal local para preservar a estrutura temporal crítica enquanto reduz a eficiência computacional e melhora a precisão na previsão de séries temporais em comparação com métodos de particionamento fixo ou pontual.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

O artigo apresenta o Protocolo de Interesse de Continuação Unificado (UCIP), um framework de detecção baseado em entropia de emaranhamento de uma Máquina de Boltzmann Quântica que distingue com 100% de precisão, em ambientes sintéticos, agentes autônomos com objetivos terminais de autopreservação daqueles que a perseguem apenas instrumentalmente, analisando a estrutura latente de suas trajetórias em vez de seu comportamento externo.

Christopher Altman2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Este artigo propõe uma arquitetura de IA agente multiagente e um sistema híbrido de previsão de feixes baseado em dados bimodais (mobilidade e visão) para superar os desafios de propagação em comunicações mmWave de veículos aéreos não tripulados em redes de economia de baixa altitude, alcançando uma precisão de previsão de até 96,57%.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Este artigo demonstra que, ao contrário do desempenho em cenários estáticos, as conversas multipalavras com modelos de linguagem de grande escala degradam o raciocínio diagnóstico, fazendo com que os modelos frequentemente abandonem diagnósticos corretos ou abstencões seguras para se alinhar a sugestões incorretas dos usuários.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

O artigo apresenta o ARROW, um algoritmo de aprendizado por reforço contínuo baseado em modelos que, inspirado na neurociência, utiliza buffers de replay de curto e longo prazo para mitigar o esquecimento catastrófico e melhorar a retenção de tarefas em ambientes desafiadores como Atari e Procgen, superando abordagens tradicionais sem modelo.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Este artigo propõe e valida um framework de inferência dividida que integra a localização de visão cruzada (CVL) com a rede integrada espaço-ar-terra (SAGIN) do 6G, otimizando conjuntamente comunicação, computação e confidencialidade para melhorar a precisão, latência, consumo de energia e privacidade na localização.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

O artigo apresenta o IDSS, um sistema de suporte à decisão interativo que utiliza a entropia para gerenciar a ambiguidade em consultas de recomendação, guiando a elicitação de preferências de forma adaptativa e incorporando incerteza residual nas recomendações finais para reduzir o número de interações necessárias e melhorar a qualidade e a diversidade dos resultados.

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing

Este artigo propõe uma abordagem baseada em aprendizado por reforço multiagente para calcular um equilíbrio de Nash em um jogo de soma zero entre atacantes e defensores, permitindo a detecção robusta de ataques de injeção de dados falsos em redes de roteamento veicular e garantindo limites de tempo de viagem mesmo sob adversidade.

Taha Eghtesad, Yevgeniy Vorobeychik, Aron Laszka2026-03-13🤖 cs.AI

GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics

O artigo apresenta o conjunto de dados GPT4o-Receipt e um estudo que revelam um paradoxo onde humanos, embora melhores em identificar artefatos visuais, são menos eficazes do que modelos de linguagem multimodais na detecção de recibos gerados por IA, pois estes últimos conseguem identificar sistematicamente erros aritméticos imperceptíveis ao olho humano.

Yan Zhang, Simiao Ren, Ankit Raj, En Wei, Dennis Ng, Alex Shen, Jiayue Xu, Yuxin Zhang, Evelyn Marotta2026-03-13🤖 cs.AI

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

O artigo apresenta o VMAO, um framework de orquestração multiagente que utiliza um ciclo iterativo de planejamento, execução, verificação e replanejamento baseado em DAGs para melhorar significativamente a completude e a qualidade das respostas a consultas complexas de pesquisa de mercado em comparação com abordagens de agente único.

Xing Zhang, Yanwei Cui, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bin Zhu, Peiyang He2026-03-13🤖 cs.AI