cs.AI artigos | Gist.Science

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Este artigo apresenta uma revisão abrangente da Avaliação Adaptativa Computadorizada (CAT) sob uma perspectiva de aprendizado de máquina, explorando como técnicas modernas podem otimizar modelos de medição, seleção de questões e controle de testes para criar sistemas mais robustos, justos e eficientes.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

O artigo apresenta o FEX, um novo framework que utiliza otimização por gradiente de política para gerar explicações baseadas em atribuição de forma rápida e escalável, reduzindo drasticamente o tempo de inferência e o uso de memória em comparação com abordagens tradicionais, sem comprometer a qualidade ou a aplicabilidade geral.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Este artigo investiga a fase de corrupção observada no ajuste fino de poucos exemplos de Modelos de Difusão, identifica sua causa na distribuição de aprendizado restrita e propõe o uso de Redes Neurais Bayesianas para mitigar esse problema, melhorando a fidelidade, qualidade e diversidade das imagens geradas sem custos adicionais de inferência.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

O artigo apresenta o LAMBDA, um sistema de análise de dados baseado em agentes de linguagem natural de código aberto e sem necessidade de programação, que combina agentes programadores e inspetores com intervenção humana direta e integração de conhecimento externo para tornar a análise de dados mais acessível e eficiente.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

O artigo apresenta o OTAD, um modelo de defesa adversarial robusto que combina treinamento de redes neurais com regularização baseada em transporte ótimo e interpolação via problema de integração convexa para garantir continuidade de Lipschitz local, superando modelos existentes em diversos conjuntos de dados.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este artigo propõe um método de Amostragem de Importância Annealed (AIS) combinado com reparametrização eficiente para otimizar o aprendizado variacional de Modelos de Variáveis Latentes de Processo Gaussiano (GPLVMs), superando as limitações de abordagens anteriores em espaços de alta dimensão e alcançando melhores limites variacionais e convergência em diversos conjuntos de dados.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este artigo apresenta o MLVAS, um sistema multimodal que integra análise de vídeo e áudio para extrair automaticamente segmentos-chave e métricas de videolaringoscopia, visando auxiliar no diagnóstico clínico da paralisia das pregas vocais.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Este artigo explora o potencial transformador da inteligência artificial na geração e validação de casos de teste, destacando como essa tecnologia supera os desafios dos métodos tradicionais ao aumentar a eficiência, a cobertura e a confiabilidade dos lançamentos de software, ao mesmo tempo em que aborda os obstáculos relacionados à qualidade dos dados e à supervisão humana.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Reconsidering the energy efficiency of spiking neural networks

Este artigo propõe uma reavaliação rigorosa da eficiência energética das Redes Neurais de Spiking (SNNs) em comparação com Redes Neurais Artificiais Quantizadas (QNNs), utilizando um modelo analítico abrangente que considera custos de movimentação de dados e memória, demonstrando que as SNNs só superam as QNNs em regimes operacionais específicos (como baixas taxas de disparo) e que, em cenários otimizados, podem dobrar a vida útil da bateria de dispositivos como relógios inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Este artigo propõe uma Rede de Osciladores Acoplados (CON) que, ao garantir estrutura lagrangiana, estabilidade global e mapeamento invertível, permite o controle de alto desempenho de sistemas físicos complexos diretamente no espaço latente utilizando apenas imagens como feedback.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Este artigo apresenta o BNEM, um amostrador baseado em Boltzmann que utiliza a técnica de correspondência de energia com ruído (NEM) combinada com um método de bootstrap para gerar amostras independentes e identicamente distribuídas a partir de funções de energia, alcançando desempenho superior e maior robustez em comparação com trabalhos anteriores.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Improving Visual Object Tracking through Visual Prompting

O artigo apresenta o PiVOT, um novo mecanismo de prompting visual que aproveita um modelo fundacional pré-treinado (CLIP) para gerar e refinar dinamicamente prompts online, permitindo que o rastreador suprima distratores e melhore o desempenho no rastreamento genérico de objetos.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artigo apresenta as Equações Diferenciais com Atraso Neurais (NDDEs), um framework contínuo inspirado no formalismo de Mori-Zwanzig que utiliza um conjunto finito de atrasos temporais para aprender dinâmicas não-Markovianas de sistemas parcialmente observáveis de forma mais eficiente e precisa do que métodos existentes como LSTMs e ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

O artigo apresenta o Puppet-CNN, um framework que modela os parâmetros de redes neurais convolucionais como um sistema dinâmico contínuo governado por equações diferenciais, permitindo a geração adaptativa de camadas baseada na complexidade da entrada e reduzindo significativamente o número de parâmetros armazenados sem comprometer o desempenho.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Este artigo propõe um novo quadro para modelos de difusão que adapta dinamicamente o processo de geração às necessidades de cada amostra, permitindo trajetórias variáveis que mantêm a qualidade da imagem enquanto reduzem o número médio de etapas de amostragem.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

The Illusion of Collusion

O estudo demonstra que agentes de aprendizado por reforço sem contexto podem desenvolver uma "colusão ingênua" em jogos repetidos, onde a emergência desse comportamento anticompetitivo depende criticamente da sincronia das ações e do tipo de política de exploração utilizada, variando de impossível em algoritmos persistentemente aleatórios a inevitável em algoritmos determinísticos.

Connor Douglas, Foster Provost, Arun Sundararajan2026-03-10💻 cs

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Este artigo propõe um método de otimização conjunta de parâmetros de sensoriamento, comunicação e velocidade de exploração para minimizar o consumo de energia em sistemas de SLAM vitalício baseados em robôs móveis com LiDAR e odometria, transmitindo dados para reconstrução de mapas em nuvem via aprendizado profundo não supervisionado.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models

O artigo apresenta o HarmonicEval, uma métrica de avaliação automática sem referência que agrega pontuações por critério de forma bottom-up, e o benchmark MMHE, composto por 18.000 julgamentos humanos em quatro tarefas multimodais, demonstrando que essa abordagem supera as métricas convencionais ao alinhar-se melhor com os julgamentos humanos em cenários de múltiplas tarefas e critérios.

Masanari Ohi, Masahiro Kaneko, Naoaki Okazaki, Nakamasa Inoue2026-03-10💬 cs.CL

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este artigo propõe um método que utiliza modelos de visão e linguagem pré-treinados para aprender modelos de mundo simbólicos abstratos a partir de demonstrações curtas, permitindo que robôs generalizem para zero-shot e resolvam problemas de tomada de decisão de longo horizonte em cenários complexos e variados através de planejamento.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Este artigo propõe estratégias de redução de dados baseadas em agrupamento no espaço latente para otimizar o treinamento adversário semi-supervisionado, permitindo alcançar robustez comparável com 5 a 10 vezes menos dados não rotulados e reduzir o tempo de execução em 3 a 4 vezes.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

← Anterior Próximo →