Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este artigo estabelece um quadro matemático unificado chamado "Gradient Flow Drifting" que demonstra a equivalência entre o modelo Drifting e o fluxo de gradiente de Wasserstein da divergência KL forward sob aproximação de estimativa de densidade por kernel, permitindo a criação de uma nova família de modelos generativos que combinam diferentes divergências para evitar colapso e borramento de modos, inclusive em variedades Riemannianas.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

O artigo propõe o Framework Retrospectivo Progressivo (PRF), uma abordagem modular que utiliza unidades de retrospectiva e uma estratégia de treinamento com início rotativo para melhorar a previsão de trajetórias em cenários de observações incompletas e variáveis, superando as limitações dos métodos existentes que dependem de mapeamentos diretos.

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Reinforcement Learning with Conditional Expectation Reward

O artigo propõe a Recompensa de Expectativa Condicional (CER), um método que utiliza o próprio modelo de linguagem como verificador implícito para fornecer sinais de recompensa graduais e eliminar a dependência de regras de verificação externas, ampliando assim a eficácia do Aprendizado por Reforço com Recompensas Verificáveis (RLVR) para domínios de raciocínio de resposta livre.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions

Este artigo propõe um quadro de trabalho inovador que intercala planeamento de tarefas e de movimentos através de um ciclo de aprendizagem incremental, onde um planeador de movimentos fornece feedback simbólico sobre conflitos espaciais e temporais para guiar um planeador de tarefas na geração de planos viáveis para navegação de múltiplos objetos em espaços partilhados.

Elisa Tosello, Arthur Bit-Monnot, Davide Lusuardi, Alessandro Valentini, Andrea Micheli2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

O artigo apresenta o DxEvolve, um agente de diagnóstico autoevolutivo que emula a cognição clínica ao requisitar exames interativamente e externalizar a experiência acumulada, superando significativamente os modelos tradicionais em precisão diagnóstica e oferecendo um caminho auditável para a evolução contínua da inteligência artificial na medicina.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Este artigo apresenta um framework de modelagem de humanos digitais agnóstico a plataformas que integra o headset OpenBCI Galea e o ambiente de jogo SuperTux para capturar dados multimodais sincronizados e estruturados, facilitando pesquisas reprodutíveis e éticas em interação multimodal e acessibilidade sem depender de modelos de IA específicos ou modificações arquitetônicas.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

Repurposing Backdoors for Good: Ephemeral Intrinsic Proofs for Verifiable Aggregation in Cross-silo Federated Learning

Este artigo propõe uma arquitetura leve para Federated Learning que utiliza a injeção de backdoors e o esquecimento catastrófico para criar provas intrínsecas efêmeras, permitindo a verificação da agregação de modelos com segurança e anonimato, ao mesmo tempo em que supera em mais de mil vezes o desempenho de soluções criptográficas tradicionais.

Xian Qin, Xue Yang, Xiaohu Tang2026-03-12🤖 cs.AI

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

O artigo apresenta o EvoSchema, um benchmark abrangente que introduz uma nova taxonomia de evolução de esquemas para avaliar e melhorar a robustez dos modelos de texto-para-SQL frente a mudanças dinâmicas em bancos de dados, demonstrando que perturbações no nível de tabelas impactam mais o desempenho e que o treinamento com dados diversificados gera sistemas mais resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Este artigo demonstra que o uso de dados estruturados vinculados, especificamente através de páginas de entidades otimizadas com instruções para agentes e interligação neural, melhora significativamente a precisão e a qualidade das respostas em sistemas de Geração Aumentada por Recuperação (RAG) padrão e orientados a agentes, superando abordagens baseadas apenas em texto plano ou metadados JSON-LD simples.

Andrea Volpini, Elie Raad, Beatrice Gamba, David Riccitelli2026-03-12🤖 cs.AI

AlphaFlowTSE: One-Step Generative Target Speaker Extraction via Conditional AlphaFlow

O artigo apresenta o AlphaFlowTSE, um modelo generativo condicional de uma única etapa para extração de fala de falante-alvo que utiliza um objetivo AlphaFlow livre de produtos vetoriais de Jacobiano para melhorar a fidelidade da fala e a generalização em cenários reais, superando as limitações de latência e confiabilidade das soluções existentes.

Duojia Li, Shuhan Zhang, Zihan Qian, Wenxuan Wu, Shuai Wang, Qingyang Hong, Lin Li, Haizhou Li2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

Este artigo apresenta o CTCNet, uma rede de cognição de tráfego multiespectral que integra conhecimento regulatório e compensação de qualidade entre modalidades óptica e térmica, juntamente com o novo benchmark Traffic-VQA, para superar as limitações de métodos existentes na compreensão de cenas de tráfego em UAVs sob condições adversas.

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

Este artigo apresenta o HIR-SDD, um novo framework para detecção de deepfakes de voz que combina Grandes Modelos de Linguagem de Áudio com raciocínio inspirado no ser humano, utilizando um conjunto de dados anotado para melhorar a generalização e fornecer explicações interpretáveis para as previsões.

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI