One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

O artigo apresenta o SMoPE, um novo framework para aprendizado contínuo baseado em prompts que utiliza uma arquitetura esparsa de Mixture of Experts para ativar dinamicamente um subconjunto de "especialistas de prompt", equilibrando assim eficiência computacional e desempenho ao mitigar interferência de conhecimento sem escalar linearmente com o número de tarefas.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

Composer: A Search Framework for Hybrid Neural Architecture Design

O artigo apresenta o Composer, um framework de busca arquitetônica modular que descobre novas arquiteturas de modelos de linguagem híbridos, superando o Llama 3.2 em desempenho, eficiência e redução de perda de validação ao explorar automaticamente combinações de primitivas computacionais e extrapolar as melhores configurações para escalas maiores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

O artigo apresenta o MIG-Vis, um método que utiliza modelos de difusão guiados por informação mútua para visualizar e validar que grupos de neurônios no córtex visual superior de macacos codificam informações visuais-semanticas estruturadas e seletivas, como pose de objetos e transformações inter e intra-categoriais.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artigo apresenta a primeira avaliação sistemática de aprendizado auto-supervisionado para o estágio do sono usando EEG vestível, demonstrando que essa abordagem supera os métodos supervisionados ao alcançar precisão clínica com apenas 5% a 10% dos dados rotulados e reduzir significativamente a dependência de anotações manuais.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Este artigo demonstra que choques geopolíticos e geoeconômicos afetam o risco soberano por canais distintos, formando um padrão de "tesoura" onde os efeitos diretos e os do ciclo financeiro global se movem em direções opostas, implicando que a liquidez pode mitigar apenas a componente mediada pelo ciclo financeiro e não o prêmio de risco geopolítico persistente.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

O artigo propõe o HyWA, um método que utiliza uma hiper-rede para gerar pesos personalizados em camadas específicas de um modelo de detecção de atividade vocal, superando as técnicas existentes ao melhorar a precisão média e facilitar a implantação através do reuso da mesma arquitetura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Predicting kernel regression learning curves from only raw data statistics

Este artigo propõe um quadro teórico baseado na "ansatz de estrutura de autovalores de Hermite" (HEA) que permite prever as curvas de aprendizado da regressão por kernel em conjuntos de dados reais, como CIFAR-5m e ImageNet, utilizando apenas estatísticas de dados brutos e demonstrando que redes MLP também aprendem polinômios de Hermite conforme previsto pelo modelo.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

Este artigo apresenta uma análise unificada baseada em geometria que demonstra que o algoritmo de Iteração de Valor converge geometricamente tanto nos cenários de recompensa descontada quanto na média, sob a suposição de uma política ótima unichain única, superando assim as garantias teóricas anteriores que subestimavam sua velocidade de convergência.

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artigo apresenta um framework hierárquico de dupla estratégia para o esquecimento seletivo em modelos de linguagem grandes aplicados à saúde, que remove conhecimento especializado sensível preservando competências médicas fundamentais com alta eficiência e garantias de privacidade.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

O artigo apresenta o CostNav, um novo benchmark que avalia agentes de IA física com base em análises econômicas realistas e dados industriais, revelando que os métodos atuais de navegação, embora focados no sucesso da tarefa, não são economicamente viáveis para aplicações comerciais no mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artigo introduz o framework PI-MDP e algoritmos de aprendizado por reforço parcialmente equivariantes (PE-DQN e PE-SAC) que mitigam erros de generalização em ambientes com quebra de simetria ao aplicar seletivamente backups de Bellman invariantes ou padrão, resultando em maior eficiência de amostragem e robustez em comparação com métodos existentes.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG