cs.LG artigos | Gist.Science

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

O artigo apresenta o SMoPE, um novo framework para aprendizado contínuo baseado em prompts que utiliza uma arquitetura esparsa de Mixture of Experts para ativar dinamicamente um subconjunto de "especialistas de prompt", equilibrando assim eficiência computacional e desempenho ao mitigar interferência de conhecimento sem escalar linearmente com o número de tarefas.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

O RADAR é um framework de roteamento leve e interpretável que otimiza o desempenho e o custo de modelos de raciocínio ao direcionar consultas com base em sua dificuldade e na capacidade dos modelos em diferentes orçamentos de raciocínio.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

O artigo apresenta o Composer, um framework de busca arquitetônica modular que descobre novas arquiteturas de modelos de linguagem híbridos, superando o Llama 3.2 em desempenho, eficiência e redução de perda de validação ao explorar automaticamente combinações de primitivas computacionais e extrapolar as melhores configurações para escalas maiores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

O artigo apresenta o MIG-Vis, um método que utiliza modelos de difusão guiados por informação mútua para visualizar e validar que grupos de neurônios no córtex visual superior de macacos codificam informações visuais-semanticas estruturadas e seletivas, como pose de objetos e transformações inter e intra-categoriais.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

O estudo demonstra que, em sistemas multiagentes de LLM, a comunicação direta é um mecanismo de coordenação mais robusto e eficaz para promover cooperação do que a aprendizagem curricular, que pode inadvertidamente induzir pessimismo e reduzir o desempenho devido a escolhas de design inadequadas.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artigo apresenta a primeira avaliação sistemática de aprendizado auto-supervisionado para o estágio do sono usando EEG vestível, demonstrando que essa abordagem supera os métodos supervisionados ao alcançar precisão clínica com apenas 5% a 10% dos dados rotulados e reduzir significativamente a dependência de anotações manuais.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Este artigo demonstra que choques geopolíticos e geoeconômicos afetam o risco soberano por canais distintos, formando um padrão de "tesoura" onde os efeitos diretos e os do ciclo financeiro global se movem em direções opostas, implicando que a liquidez pode mitigar apenas a componente mediada pelo ciclo financeiro e não o prêmio de risco geopolítico persistente.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

O artigo propõe o HyWA, um método que utiliza uma hiper-rede para gerar pesos personalizados em camadas específicas de um modelo de detecção de atividade vocal, superando as técnicas existentes ao melhorar a precisão média e facilitar a implantação através do reuso da mesma arquitetura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

O artigo apresenta um framework generativo explicável e consciente de viés que unifica fusão de atenção multimodal, atribuição Grad-CAM++ e um ciclo de feedback "Reveal-to-Revise", demonstrando desempenho superior e maior robustez em benchmarks de geração de imagens e classificação de texto.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

Este artigo apresenta novos índices absolutos de validação de clusters que definem funções de compactação e margens de separabilidade para determinar o número verdadeiro de clusters, demonstrando sua eficácia em comparação com índices relativos tradicionais em diversos conjuntos de dados sintéticos e reais.

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

Este artigo propõe um quadro teórico baseado na "ansatz de estrutura de autovalores de Hermite" (HEA) que permite prever as curvas de aprendizado da regressão por kernel em conjuntos de dados reais, como CIFAR-5m e ImageNet, utilizando apenas estatísticas de dados brutos e demonstrando que redes MLP também aprendem polinômios de Hermite conforme previsto pelo modelo.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

Este artigo apresenta uma análise unificada baseada em geometria que demonstra que o algoritmo de Iteração de Valor converge geometricamente tanto nos cenários de recompensa descontada quanto na média, sob a suposição de uma política ótima unichain única, superando assim as garantias teóricas anteriores que subestimavam sua velocidade de convergência.

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

O artigo apresenta o KVTC, um codificador de transformada leve que comprime caches de chave-valor em modelos de linguagem grandes usando decorrelação de recursos baseada em PCA, quantização adaptativa e codificação de entropia, alcançando uma redução de até 20 vezes no uso de memória sem comprometer a precisão do raciocínio ou do contexto longo.

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

O artigo apresenta os Modelos Causais de Séries Temporais Aumentados (ATSCM), uma abordagem que integra descoberta causal neural e raciocínio contrafactual para detectar regimes em mercados de energia e analisar como variáveis como a geração renovável influenciam os preços em tempo real.

Dennis Thumm2026-03-12📊 stat

Towards Causal Market Simulators

O artigo propõe o TNCM-VAE, um modelo que combina autoencoders variacionais com modelos causais estruturais para gerar séries temporais financeiras sintéticas com relações causais preservadas, permitindo análises contrafactuais e testes de estresse mais precisos.

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Este artigo propõe o framework DGET, uma arquitetura de aprendizado multi-tarefa que combina Redes Neurais em Grafos e Transformers para otimizar o agendamento em redes IoT híbridas de RF e ópticas, alcançando desempenho próximo ao ótimo com menor complexidade computacional e robustez sob observação parcial do canal.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

O artigo apresenta o STREAM-VAE, um modelo de autoencoder variacional com roteamento de dupla via que separa dinâmicas de deriva lenta e picos rápidos em dados de telemetria veicular para melhorar a detecção robusta de anomalias em comparação com métodos existentes.

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artigo apresenta um framework hierárquico de dupla estratégia para o esquecimento seletivo em modelos de linguagem grandes aplicados à saúde, que remove conhecimento especializado sensível preservando competências médicas fundamentais com alta eficiência e garantias de privacidade.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

O artigo apresenta o CostNav, um novo benchmark que avalia agentes de IA física com base em análises econômicas realistas e dados industriais, revelando que os métodos atuais de navegação, embora focados no sucesso da tarefa, não são economicamente viáveis para aplicações comerciais no mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artigo introduz o framework PI-MDP e algoritmos de aprendizado por reforço parcialmente equivariantes (PE-DQN e PE-SAC) que mitigam erros de generalização em ambientes com quebra de simetria ao aplicar seletivamente backups de Bellman invariantes ou padrão, resultando em maior eficiência de amostragem e robustez em comparação com métodos existentes.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

← Anterior Próximo →