Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

O artigo apresenta o framework de Transição de Hierarquia de Normas (NHT), que explica como a regularização por peso (weight decay) guia redes neurais a abandonar gradualmente soluções de atalho de alta norma em favor de representações estruturadas de baixa norma, unificando fenômenos como o "grokking" e o aprendizado tardio de características sob um mecanismo comum de travessia hierárquica de normas.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Este artigo apresenta e valida experimentalmente uma abordagem de detecção de interferência em redes 5G baseada na Máquina Tsetlin Convolutiva (CTM), que, ao operar diretamente em blocos de sinal de sincronização, oferece uma alternativa leve, explicável e eficiente em hardware em comparação com redes neurais convolucionais, alcançando desempenho comparável com treinamento significativamente mais rápido e menor consumo de memória.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

O AgrI Challenge é uma competição centrada em dados que introduz o paradigma de Validação entre Equipes (CTV) para avaliar a generalização de modelos de visão agrícola em cenários reais, demonstrando que o treinamento colaborativo com dados coletados independentemente por múltiplas equipes reduz significativamente as lacunas de generalização em comparação com o treinamento em fonte única.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Este artigo propõe o uso de priores generativos com complexidade ajustável, baseados em técnicas como *nested dropout*, para superar as limitações de modelos de complexidade fixa em problemas inversos como compressão de sensores e remoção de ruído, demonstrando empiricamente e teoricamente reconstruções mais precisas e adaptadas ao nível de ruído.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Este artigo investiga as leis de escalonamento no regime de modelos extremamente pequenos (sub-20M parâmetros), revelando que, ao contrário do observado em modelos maiores, a redução de tamanho altera qualitativamente a estrutura dos erros, melhora a calibração e satura mais rapidamente, demonstrando que a validação de desempenho para dispositivos de borda deve ocorrer especificamente no tamanho alvo do modelo.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Este artigo propõe uma estrutura de Aprendizado por Reforço Multiagente Hierárquico (HMARL) para sistemas mmWave que elimina a necessidade de estimativa de CSI ao utilizar dados de localização de usuários, alcançando ganhos significativos de RSSI e escalabilidade através de uma abordagem de treinamento centralizado com execução descentralizada.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Este artigo investiga a estimativa de qualidade de tradução automática para línguas indicas em cenários de baixo recurso, demonstrando que a adaptação de camadas intermediárias de modelos de linguagem (como ALOPE e LoRMA) supera abordagens puramente baseadas em prompts, especialmente em domínios de alto risco, e disponibiliza conjuntos de dados e código para pesquisa futura.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Este artigo apresenta o MARIGOLD, um novo framework unificado que resolve problemas de aprendizado multi-tarefa de forma eficiente ao modelar o equilíbrio de gradientes como um problema de otimização bi-nível e aplicando métodos de ordem zero para superar as limitações computacionais de abordagens anteriores.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este artigo propõe um novo quadro teórico baseado na "Capacidade do Canal de Contexto" para explicar e prever o esquecimento catastrófico na aprendizagem contínua, demonstrando que arquiteturas que garantem um caminho de contexto estruturalmente obrigatório (como HyperNetworks) superam as limitações teóricas de métodos baseados em algoritmos e alcançam a retenção perfeita de tarefas.

Ran Cheng2026-03-10🤖 cs.LG