cs.AI artigos | Gist.Science

Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

Este artigo estabelece um quadro matemático unificado chamado "Gradient Flow Drifting" que demonstra a equivalência entre o modelo Drifting e o fluxo de gradiente de Wasserstein da divergência KL forward sob aproximação de estimativa de densidade por kernel, permitindo a criação de uma nova família de modelos generativos que combinam diferentes divergências para evitar colapso e borramento de modos, inclusive em variedades Riemannianas.

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

O artigo propõe o Framework Retrospectivo Progressivo (PRF), uma abordagem modular que utiliza unidades de retrospectiva e uma estratégia de treinamento com início rotativo para melhorar a previsão de trajetórias em cenários de observações incompletas e variáveis, superando as limitações dos métodos existentes que dependem de mapeamentos diretos.

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Este artigo apresenta um novo framework para agentes autônomos que melhora o desempenho futuro ao extrair automaticamente aprendizados estruturados de trajetórias de execução e recuperá-los contextualmente, resultando em ganhos significativos na conclusão de tarefas complexas.

Gaodan Fang, Vatche Isahagian, K. R. Jayaram, Ritesh Kumar, Vinod Muthusamy, Punleuk Oum, Gegi Thomas2026-03-12🤖 cs.AI

Reinforcement Learning with Conditional Expectation Reward

O artigo propõe a Recompensa de Expectativa Condicional (CER), um método que utiliza o próprio modelo de linguagem como verificador implícito para fornecer sinais de recompensa graduais e eliminar a dependência de regras de verificação externas, ampliando assim a eficácia do Aprendizado por Reforço com Recompensas Verificáveis (RLVR) para domínios de raciocínio de resposta livre.

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

Este artigo apresenta uma abordagem inovadora e explicável para detectar e eliminar gatilhos de backdoor em redes neurais, utilizando caminhos ativos e validando sua eficácia em um modelo de detecção de intrusão.

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions

Este artigo propõe um quadro de trabalho inovador que intercala planeamento de tarefas e de movimentos através de um ciclo de aprendizagem incremental, onde um planeador de movimentos fornece feedback simbólico sobre conflitos espaciais e temporais para guiar um planeador de tarefas na geração de planos viáveis para navegação de múltiplos objetos em espaços partilhados.

Elisa Tosello, Arthur Bit-Monnot, Davide Lusuardi, Alessandro Valentini, Andrea Micheli2026-03-12🤖 cs.AI

Are Video Reasoning Models Ready to Go Outside?

O artigo apresenta o ROVA, um novo framework de treinamento que melhora a robustez de modelos de visão e linguagem em cenários do mundo real ao utilizar uma estratégia de aprendizado online adaptativa e uma recompensa de consistência, validada pelo novo benchmark PVRBench que demonstra ganhos significativos de precisão e raciocínio sob perturbações como clima e oclusão.

Yangfan He, Changgyu Boo, Jaehong Yoon2026-03-12🤖 cs.AI

FAME: Formal Abstract Minimal Explanation for Neural Networks

O artigo propõe o FAME, um novo método de explicações abdutivas baseado em interpretação abstrata que escala para grandes redes neurais, reduzindo o tamanho das explicações e eliminando a dependência da ordem de travessia através de domínios de perturbação dedicados e limites baseados em LiRPA.

Ryma Boumazouza, Raya Elsaleh, Melanie Ducoffe, Shahaf Bassan, Guy Katz2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

O artigo apresenta o DxEvolve, um agente de diagnóstico autoevolutivo que emula a cognição clínica ao requisitar exames interativamente e externalizar a experiência acumulada, superando significativamente os modelos tradicionais em precisão diagnóstica e oferecendo um caminho auditável para a evolução contínua da inteligência artificial na medicina.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Este artigo apresenta um framework de modelagem de humanos digitais agnóstico a plataformas que integra o headset OpenBCI Galea e o ambiente de jogo SuperTux para capturar dados multimodais sincronizados e estruturados, facilitando pesquisas reprodutíveis e éticas em interação multimodal e acessibilidade sem depender de modelos de IA específicos ou modificações arquitetônicas.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

Contract And Conquer: How to Provably Compute Adversarial Examples for a Black-Box Model?

O artigo apresenta o método "Contract And Conquer" (CAC), que utiliza conhecimento destilado e contração do espaço de busca para garantir a geração provável de exemplos adversariais para modelos de caixa preta, superando os métodos atuais de ponta no conjunto de dados ImageNet.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.LG

Repurposing Backdoors for Good: Ephemeral Intrinsic Proofs for Verifiable Aggregation in Cross-silo Federated Learning

Este artigo propõe uma arquitetura leve para Federated Learning que utiliza a injeção de backdoors e o esquecimento catastrófico para criar provas intrínsecas efêmeras, permitindo a verificação da agregação de modelos com segurança e anonimato, ao mesmo tempo em que supera em mais de mil vezes o desempenho de soluções criptográficas tradicionais.

Xian Qin, Xue Yang, Xiaohu Tang2026-03-12🤖 cs.AI

RandMark: On Random Watermarking of Visual Foundation Models

O artigo "RandMark" propõe um método de marcação d'água aleatória que utiliza uma pequena rede encoder-decoder para embutir marcas digitais em representações internas de modelos fundacionais visuais, permitindo a verificação eficaz da propriedade intelectual com baixas taxas de falsos positivos e falsos negativos.

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.AI

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

O artigo apresenta o EvoSchema, um benchmark abrangente que introduz uma nova taxonomia de evolução de esquemas para avaliar e melhorar a robustez dos modelos de texto-para-SQL frente a mudanças dinâmicas em bancos de dados, demonstrando que perturbações no nível de tabelas impactam mais o desempenho e que o treinamento com dados diversificados gera sistemas mais resilientes.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

Structured Linked Data as a Memory Layer for Agent-Orchestrated Retrieval

Este artigo demonstra que o uso de dados estruturados vinculados, especificamente através de páginas de entidades otimizadas com instruções para agentes e interligação neural, melhora significativamente a precisão e a qualidade das respostas em sistemas de Geração Aumentada por Recuperação (RAG) padrão e orientados a agentes, superando abordagens baseadas apenas em texto plano ou metadados JSON-LD simples.

Andrea Volpini, Elie Raad, Beatrice Gamba, David Riccitelli2026-03-12🤖 cs.AI

AlphaFlowTSE: One-Step Generative Target Speaker Extraction via Conditional AlphaFlow

O artigo apresenta o AlphaFlowTSE, um modelo generativo condicional de uma única etapa para extração de fala de falante-alvo que utiliza um objetivo AlphaFlow livre de produtos vetoriais de Jacobiano para melhorar a fidelidade da fala e a generalização em cenários reais, superando as limitações de latência e confiabilidade das soluções existentes.

Duojia Li, Shuhan Zhang, Zihan Qian, Wenxuan Wu, Shuai Wang, Qingyang Hong, Lin Li, Haizhou Li2026-03-12🤖 cs.AI

Probabilistic Verification of Voice Anti-Spoofing Models

O artigo apresenta o PV-VASM, uma estrutura probabilística model-agnóstica que verifica a robustez de modelos de anti-falsificação de voz ao estimar a probabilidade de erro sob diversas técnicas de síntese e perturbações, oferecendo garantias teóricas de segurança contra ameaças de deepfakes.

Evgeny Kushnir, Alexandr Kozodaev, Dmitrii Korzh, Mikhail Pautov, Oleg Kiriukhin, Oleg Y. Rogov2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

Este artigo apresenta o CTCNet, uma rede de cognição de tráfego multiespectral que integra conhecimento regulatório e compensação de qualidade entre modalidades óptica e térmica, juntamente com o novo benchmark Traffic-VQA, para superar as limitações de métodos existentes na compreensão de cenas de tráfego em UAVs sob condições adversas.

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

Este artigo apresenta o HIR-SDD, um novo framework para detecção de deepfakes de voz que combina Grandes Modelos de Linguagem de Áudio com raciocínio inspirado no ser humano, utilizando um conjunto de dados anotado para melhorar a generalização e fornecer explicações interpretáveis para as previsões.

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

O artigo apresenta o CUPID, um módulo plug-in versátil que estima conjuntamente a incerteza aleatória e epistêmica em redes neurais pré-treinadas sem necessidade de retreinamento, permitindo uma análise interpretável e model-agnóstica da origem das incertezas em diversas tarefas de aprendizado profundo.

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG

← Anterior Próximo →