On Sample-Efficient Generalized Planning via Learned Transition Models

Este trabalho propõe formular o planejamento generalizado como um problema de aprendizado de modelos de transição explícitos, demonstrando que prever estados intermediários em vez de ações diretas resulta em maior generalização fora da distribuição e eficiência amostral com modelos menores do que as abordagens baseadas em Transformers que predizem sequências de ações diretamente.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Este artigo descreve como o uso de um modelo de linguagem grande (LLM) especializado e ajustado para gerar milhões de rótulos de relevância textual permitiu aprimorar o sistema de classificação da App Store, resultando em ganhos simultâneos na relevância comportamental e textual e em um aumento estatisticamente significativo na taxa de conversão, especialmente para consultas de cauda longa.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

O artigo apresenta o Attn-QAT, um método pioneiro de treinamento consciente de quantização (QAT) para atenção em FP4 que, ao corrigir instabilidades de treinamento através de recomputação de baixa precisão e ajustes nos cálculos de gradiente, permite a computação de ponta a ponta em FP4 sem heurísticas de mitigação de outliers, recuperando a qualidade do modelo e oferecendo até 1,5x de aceleração em GPUs RTX 5090.

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

How Well Do Multimodal Models Reason on ECG Signals?

Este trabalho apresenta um quadro reprodutível para avaliar o raciocínio de modelos multimodais em sinais de ECG, decompondo-o em percepção (verificada via geração de código) e dedução (validada contra critérios clínicos estruturados), permitindo uma avaliação escalável e rigorosa da verdadeira capacidade de raciocínio clínico.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Extended Empirical Validation of the Explainability Solution Space

Este relatório técnico valida estendida e empiricamente a Espaço de Soluções de Explicabilidade (ESS) através de uma avaliação transversal que, além da previsão de rotatividade de funcionários, incorpora um sistema heterogêneo de alocação de recursos urbanos inteligentes, demonstrando a generalidade e adaptabilidade do framework a diferentes domínios, perfis de risco e configurações de partes interessadas.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

O artigo apresenta o HarmonyCell, um framework de agente autônomo que resolve as heterogeneidades semântica e estatística em estudos de perturbação de células únicas, unificando metadados via LLM e otimizando arquiteturas de modelos com busca em árvore Monte Carlo para superar deslocamentos de distribuição sem necessidade de engenharia específica por conjunto de dados.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Este artigo apresenta o GramCol e o IMAP, métodos que localizam espacial e temporalmente conceitos de movimento e objetos em Transformers de Difusão de Vídeo sem necessidade de cálculo de gradiente ou atualização de parâmetros, oferecendo mapas de saliência interpretáveis para tarefas como segmentação semântica zero-shot.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

O artigo apresenta a Decomposição de Sonda Composicional (CPD) para demonstrar que a alinhamento da tarefa de treinamento e a arquitetura equivariante são fatores determinantes que moldam a acessibilidade linear e a disjunção de informações geométricas e composicionais em modelos de base atômica, revelando que modelos treinados em propriedades específicas (como o gap HOMO-LUMO) organizam seus representações de forma mais eficiente do que aqueles treinados apenas em energia.

Joshua Steier2026-03-10🤖 cs.LG