AMiD: Knowledge Distillation for LLMs with αα-mixture Assistant Distribution

O artigo propõe o AMiD, um novo framework unificado para destilação de conhecimento em LLMs que introduz uma distribuição de assistente baseada em mistura-α\alpha e uma família generalizada de divergências, superando as limitações de estabilidade e desempenho dos métodos anteriores ao explorar sistematicamente o espaço de interpolação e otimização.

Donghyeok Shin, Yeongmin Kim, Suhyeon Jo + 2 more2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Este trabalho demonstra que o viés implícito do Adam com amostras individuais (incremental) em dados linearmente separáveis pode divergir do regime de lote completo, convergindo para classificadores de margem máxima em normas diferentes (como 2\ell_2 em vez de \ell_\infty) dependendo do conjunto de dados, ao contrário do Signum, que mantém invariância no viés para qualquer tamanho de lote.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum

Este artigo propõe o CNFP, um novo framework baseado em Modelos Probabilísticos de Difusão que otimiza o placement de Funções de Rede Nativas em Nuvem no continuum nuvem-continuum, superando as limitações de escalabilidade e generalização de abordagens clássicas ao gerar soluções viáveis e de alta qualidade com inferência acelerada.

Álvaro Vázquez Rodríguez, Manuel Fernández-Veiga, Carlos Giraldo-Rodríguez2026-03-05🤖 cs.LG

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Este estudo demonstra que modelos de áudio auto-supervisionados com alto desempenho em tarefas downstream apresentam representações internas mais alinhadas à atividade cerebral auditiva, sugerindo que a similaridade com o cérebro é um subproduto emergente da aprendizagem para reconstruir dados de áudio naturais.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

NRR-Core: Non-Resolution Reasoning as a Computational Framework for Contextual Identity and Ambiguity Preservation

O artigo propõe o NRR-Core, um novo quadro computacional que desafia as limitações arquitetônicas atuais da IA ao rejeitar a resolução prematura de ambiguidades, mantendo múltiplas interpretações coexistentes através de princípios como não-identidade e rastreamento de identidade contextual para preservar a flexibilidade interpretativa até a chegada de informações suficientes.

Kei Saito2026-03-05🤖 cs.AI

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

O artigo propõe o OASI, um método de inicialização de surrogate para otimização bayesiana multiobjetivo que utiliza soluções geradas por simulated annealing para identificar rapidamente modelos de reconhecimento de voz viáveis em microcontroladores, superando métodos tradicionais em eficiência e robustez sob restrições rigorosas de memória.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Succeeding at Scale: Automated Dataset Construction and Query-Side Adaptation for Multi-Tenant Search

O artigo apresenta o DevRev-Search, um benchmark para recuperação de passagens em suporte técnico construído via pipeline automatizado, e propõe uma estratégia de adaptação que preserva o índice ao fine-tunar apenas o codificador de consultas, permitindo a evolução eficiente de sistemas de busca multi-tenant sem a necessidade de reindexação completa.

Prateek Jain, Shabari S Nair, Ritesh Goru + 4 more2026-03-05🤖 cs.AI