cs.LG artigos | Gist.Science

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Este trabalho revela a plasticidade comportamental inerente aos Grandes Modelos de Linguagem e propõe o ToCoRL, um quadro de aprendizado por reforço que internaliza essa adaptabilidade condicional a tokens, permitindo um controle preciso do comportamento do modelo sem degradação de capacidades.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Este artigo aborda a instabilidade da decomposição de valores não linear no aprendizado por reforço multiagente offline ao propor a normalização de valores invariante à escala (SVN) para estabilizar o treinamento e estabelecer uma receita prática que desbloqueia o pleno potencial desse paradigma.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Geometrically Constrained Outlier Synthesis

O artigo apresenta o GCOS, um framework de regularização que sintetiza outliers virtuais no espaço de características respeitando a estrutura geométrica dos dados de treinamento e utilizando limites adaptativos para melhorar a detecção de dados fora de distribuição (OOD) e permitir inferência conformal com garantias estatísticas.

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Meta-RL with Shared Representations Enables Fast Adaptation in Energy Systems

Este artigo apresenta um novo framework de Meta-RL com representações compartilhadas e otimização bi-nível que, ao integrar arquiteturas híbridas e mecanismos de transferência de conhecimento, permite adaptação rápida e eficiente em sistemas de gestão de energia, superando métodos convencionais em dados reais de longo prazo.

Théo Zangato, Aomar Osmani, Pegah Alizadeh2026-03-10🤖 cs.LG

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

O artigo apresenta o SYNAPSE, um framework sistemático e sem necessidade de re-treinamento que analisa e perturba o comportamento interno de modelos Transformer para avaliar sua robustez e revelar padrões de organização e vulnerabilidade em suas representações neuronais.

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

O artigo apresenta o IronEngine, uma plataforma de assistente de IA geral que integra uma orquestração unificada, memória persistente e execução de ferramentas através de um pipeline de três fases, demonstrando desempenho superior em tarefas heterogêneas e posicionando-se como uma base orientada a sistemas para assistentes pessoais e automação.

Xi Mo2026-03-10🤖 cs.LG

Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning

O artigo propõe o framework GRACE, uma estratégia cíclica de "Crescer, Avaliar e Comprimir" que gerencia adaptativamente a capacidade do modelo no Aprendizado Incremental de Classes, alcançando desempenho de ponta enquanto reduz a pegada de memória em até 73% ao evitar o crescimento descontrolado de parâmetros.

Adrian Garcia-Castañeda, Jon Irureta, Jon Imaz, Aizea Lojo2026-03-10🤖 cs.LG

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Este estudo prospectivo de viabilidade demonstrou que um sistema de IA conversacional baseado em LLM (AMIE) foi seguro, bem recebido por pacientes e clínicos, e produziu diagnósticos diferenciais e planos de manejo de qualidade comparável à dos médicos de atenção primária em um ambiente de urgência real, embora os médicos tenham superado a IA na praticidade e custo-efetividade dos planos de tratamento.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

O LycheeCluster é um método inovador para gerenciamento eficiente de cache KV em modelos de linguagem grandes que, ao utilizar fragmentação consciente de limites e indexação hierárquica recursiva, reduz a complexidade de recuperação de linear para logarítmica, alcançando até 3,6 vezes mais velocidade de inferência com degradação mínima de desempenho.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

Este artigo demonstra que a detecção de desvios graduais em agentes de RL baseados em modelos de mundo ocorre apenas acima de um limiar crítico universal ( $\varepsilon^*$ ), cuja posição é determinada pela interação entre a sensibilidade do detector, a estrutura do ruído e a dinâmica do ambiente, revelando que certos tipos de desvio (como os sinusoidais) são intrinsecamente indetectáveis e que ambientes frágeis podem colapsar antes que qualquer monitoramento seja acionado.

Zhe Hong2026-03-10🤖 cs.LG

Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking

Este artigo apresenta um rastreador de partículas com fusão de sensores heterogêneos (câmera e LiDAR) que utiliza uma política adaptativa baseada em ganho de informação para selecionar dinamicamente o sensor mais informativo, demonstrando em um teste real no Chipre que essa abordagem oferece um equilíbrio superior entre precisão e continuidade na vigilância marítima em comparação com o uso isolado de sensores ou a fusão contínua de todos os dados.

Andrei Starodubov, Yaqub Aris Prabowo, Andreas Hadjipieris, Ioannis Kyriakides, Roberto Galeazzi2026-03-10🤖 cs.LG

Data-Driven Priors for Uncertainty-Aware Deterioration Risk Prediction with Multimodal Data

O artigo apresenta o $\texttt{MedCertAIn}$ , um framework de previsão de risco hospitalar que utiliza dados multimodais e priores baseados em dados para melhorar a precisão preditiva e a quantificação de incerteza em modelos de IA para aplicações clínicas de alto risco.

L. Julián Lechuga López, Tim G. J. Rudner, Farah E. Shamout2026-03-10🤖 cs.LG

Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

Este artigo propõe o "Conditional Information Bottleneck" (CIB) como um novo quadro teórico para unificar o "Budget Forcing" em modelos de linguagem, tratando o raciocínio como um problema de compressão que preserva apenas as informações essenciais para a resposta, permitindo assim reduzir custos de inferência sem sacrificar a precisão lógica.

Fabio Valerio Massoli, Andrey Kuzmin, Arash Behboodi2026-03-10🤖 cs.LG

MUSA-PINN: Multi-scale Weak-form Physics-Informed Neural Networks for Fluid Flow in Complex Geometries

O artigo apresenta o MUSA-PINN, uma rede neural física-informada de múltiplas escalas baseada em formulação fraca que supera as limitações de convergência em geometrias complexas, como superfícies mínimas triplamente periódicas, ao reformular as restrições de PDE como leis de conservação integrais em volumes de controle hierárquicos, resultando em erros significativamente menores e melhor conservação de massa.

Weizheng Zhang, Xunjie Xie, Hao Pan, Xiaowei Duan, Bingteng Sun, Qiang Du, Lin lu2026-03-10🤖 cs.LG

Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning

Este artigo propõe a integração de Redes Neurais Lagrangianas (LNNs) no framework Dyna para Aprendizado por Reforço baseado em Modelo, demonstrando que o uso de otimizadores baseados em estimativa de estado acelera a convergência e melhora a precisão das previsões de dinâmica ao impor leis físicas subjacentes.

Shreya Das, Kundan Kumar, Muhammad Iqbal, Outi Savolainen, Dominik Baumann, Laura Ruotsalainen, Simo Särkkä2026-03-10🤖 cs.LG

STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching

O artigo apresenta o STRIDE, um framework de aprendizado de dinâmica que combina uma Rede Neural Lagrangiana para modelar a mecânica rígida conservativa com Fluxo de Condição para capturar efeitos estocásticos de interação, resultando em previsões mais precisas e confiáveis para o controle de robôs em ambientes incertos.

Prakrut Kotecha, Ganga Nair B, Shishir Kolathaya2026-03-10🤖 cs.LG

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

O artigo apresenta o X-AVDT, um detector de deepfakes robusto que explora mecanismos de atenção cruzada interna dos geradores para alinhar áudio e vídeo, alcançando desempenho superior e generalização em um novo conjunto de dados multimodal (MMDF) que abrange diversas tecnologias de síntese.

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

NN-OpInf: an operator inference approach using structure-preserving composable neural networks

O artigo apresenta o NN-OpInf, uma estrutura de inferência de operadores não intrusiva e que preserva a estrutura, baseada em redes neurais compostas, que supera os métodos polinomiais tradicionais na modelagem de sistemas dinâmicos com não linearidades complexas, oferecendo maior precisão e estabilidade, embora com custos computacionais de treinamento mais elevados.

Eric Parish, Anthony Gruber, Patrick Blonigan, Irina Tezaur2026-03-10🤖 cs.LG

Pareto-Optimal Anytime Algorithms via Bayesian Racing

O artigo apresenta o PolarBear, um quadro baseado em inferência bayesiana e rankings que identifica o conjunto de Pareto ótimo de algoritmos de tempo qualquer sem necessidade de normalização ou limites conhecidos, permitindo a eliminação adaptativa de algoritmos dominados e a seleção robusta sob preferências temporais arbitrárias.

Jonathan Wurth, Helena Stegherr, Neele Kemper, Michael Heider, Jörg Hähner2026-03-10🤖 cs.LG

Efficient Credal Prediction through Decalibration

Este artigo propõe um método eficiente de "decalibração" para gerar conjuntos credais (intervalos de probabilidade) que representam incerteza epistêmica em modelos complexos, como TabPFN e CLIP, superando as limitações computacionais de abordagens anteriores baseadas em ensembles.

Paul Hofman, Timo Löhr, Maximilian Muschalik, Yusuf Sale, Eyke Hüllermeier2026-03-10🤖 cs.LG

← Anterior Próximo →