Task-Conditioned Routing Signatures in Sparse Mixture-of-Experts Transformers

Este artigo demonstra que os mecanismos de roteamento em arquiteturas Sparse Mixture-of-Experts (MoE) exibem uma estrutura sensível à tarefa, onde prompts da mesma categoria geram assinaturas de roteamento altamente similares que permitem a classificação precisa de tarefas, sugerindo que o roteamento é um componente condicional mensurável e não apenas um mecanismo de equilíbrio de carga.

Mynampati Sri Ranganadha Avinash2026-03-13🤖 cs.LG

A Learning-Based Superposition Operator for Non-Renewal Arrival Processes in Queueing Networks

Este artigo propõe um operador de superposição baseado em aprendizado profundo que, ao mapear momentos e descritores de autocorrelação de fluxos de entrada não renováveis, permite uma avaliação escalável e precisa de redes de filas com convergência de tráfego, superando as limitações das aproximações clássicas ao preservar informações de variabilidade e dependência de ordem superior.

Eliran Sherzer2026-03-13🤖 cs.LG

High-resolution weather-guided surrogate modeling for data-efficient cross-location building energy prediction

Este estudo apresenta um modelo substituto de alta resolução, orientado por dados meteorológicos semanais, que supera as limitações de generalização das abordagens anteriores ao capturar padrões recorrentes de demanda energética, permitindo prever com precisão o consumo de energia em edifícios de diferentes localizações sem a necessidade de simulações extensas em múltiplos sites.

Piragash Manmatharasan, Girma Bitsuamlak, Katarina Grolinger2026-03-13🤖 cs.LG

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

O artigo apresenta o Co-Diffusion, um novo framework de duas etapas baseado em difusão latente que supera as limitações de generalização em regimes de frio extremo ao alinhar embeddings de fármacos e alvos em um manifold orientado pela afinidade e aplicar difusão latente específica de modalidade como regularizador estocástico, resultando em desempenho superior na previsão de afinidade fármaco-alvo, especialmente para estruturas moleculares e famílias proteicas não vistas.

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun Liu2026-03-13📊 stat

Scaling Reasoning Efficiently via Relaxed On-Policy Distillation

O artigo apresenta o REOPOLD, um framework de destilação on-policy relaxada que estabiliza o treinamento ao interpretar a relação professor-aluno como recompensa de otimização de política, resultando em maior eficiência de amostragem e desempenho superior em tarefas de raciocínio matemático, visual e de agentes em comparação com abordagens anteriores.

Jongwoo Ko, Sara Abdali, Young Jin Kim, Tianyi Chen, Pashmina Cameron2026-03-13🤖 cs.LG

H2LooP Spark Preview: Continual Pretraining of Large Language Models for Low-Level Embedded Systems Code

O artigo apresenta o H2LooP Spark Preview, um pipeline de pré-treinamento contínuo que adapta o modelo de linguagem aberto OLMo-3-7B para o domínio de sistemas embarcados de baixo nível, resultando em um modelo de 7B que supera sistemas fechados de ponta em tarefas específicas de código ao ser treinado com 23,5 bilhões de tokens de dados especializados.

Amit Singh, Vedant Nipane, Pulkit Agrawal, Jatin Kishnani2026-03-13🤖 cs.LG

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

O artigo utiliza técnicas de interpretabilidade mecânica para revelar que, em modelos VideoViT pré-treinados, a representação causal de resultados de ações humanas (sucesso vs. falha) é gerada por um circuito distribuído e redundante onde os mecanismos de atenção atuam como coletores de evidências e os blocos MLP como compositores de conceitos, demonstrando que modelos de classificação podem desenvolver "conhecimento oculto" sofisticado que exige supervisão mecânica para garantir AI confiável.

Sai V R Chereddy2026-03-13🤖 cs.LG

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

Este artigo estabelece uma análise sistemática de leis de escala para ataques de jailbreak em modelos de linguagem grandes, demonstrando que métodos baseados em prompt são mais eficientes computacionalmente e alcançam maior sucesso e sigilo do que abordagens de otimização, além de revelar que a vulnerabilidade varia significativamente dependendo do tipo de dano pretendido.

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran2026-03-13🤖 cs.LG

Huntington Disease Automatic Speech Recognition with Biomarker Supervision

Este artigo apresenta um estudo sistemático de reconhecimento automático de fala para a doença de Huntington, demonstrando que a adaptação específica da doença e o uso de supervisão auxiliar baseada em biomarcadores reduzem significativamente a taxa de erro, ao mesmo tempo em que revela padrões de erro distintos dependentes da gravidade da condição.

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG