Identifying Adversary Characteristics from an Observed Attack

Este artigo propõe e demonstra um framework para identificar as características do atacante a partir de um ataque observado, provando que a identificação é impossível sem conhecimento adicional e oferecendo uma abordagem agnóstica ao domínio para determinar o provável agressor, o que permite tanto a mitigação exógena quanto a melhoria do desempenho de métodos de defesa diretos.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Este artigo propõe o Interpolated FID (iFID), uma métrica simples baseada na interpolação no espaço latente que supera o FID de reconstrução tradicional ao demonstrar uma forte correlação com a qualidade de geração de modelos de difusão latente, permitindo prever com precisão o desempenho desses modelos.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Este artigo propõe a Contagem Implícita de Erros (IEC), uma abordagem de aprendizado por reforço sem referência que enumera e pondera erros em vez de verificar acertos contra um gabarito, demonstrando sua superioridade em tarefas de "virtual try-on" onde múltiplas respostas válidas tornam a geração de rubricas tradicional inviável.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Este artigo demonstra que, no contexto de regressão de crista com características aleatórias, é possível obter leis de escala significativamente melhores ao treinar um modelo forte com rótulos imperfeitos de um modelo fraco, permitindo que o aluno atinja taxas de erro ótimas mesmo quando o professor não apresenta melhoria com o aumento dos dados.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Este artigo investiga estratégias de paralelização para a implantação de modelos de linguagem densos, demonstrando que o Paralelismo de Tensores (TP) otimiza a latência enquanto o Paralelismo de Pipeline (PP) favorece a vazão, e que a combinação híbrida dessas técnicas permite gerenciar eficazmente o compromisso entre esses dois indicadores de desempenho.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artigo estabelece um framework geométrico baseado em fibrados principais para analisar as limitações fundamentais e as oportunidades na aprendizagem de equações diferenciais que governam a evolução de redes temporais modeladas por Grafos de Produto Aleatório (RDPGs), demonstrando como a estrutura dinâmica pode resolver ambiguidades de gauge e unificando a dificuldade geométrica com a estatística através de lacunas espectrais.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

O artigo alerta que a rápida adoção da IA na ciência climática, embora prometa avanços, corre o risco de ampliar a desigualdade global ao concentrar infraestrutura e dados no Norte Global, exigindo uma mudança de paradigma para uma abordagem centrada em dados, infraestrutura digital pública e co-produção de conhecimento para garantir equidade e resiliência sistêmica.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudo demonstra que a adaptação de domínio não supervisionada, especificamente através da minimização da discrepância máxima de momento (MMD), permite que modelos de aprendizado de máquina treinados em dados sintéticos de espectroscopia gama generalizem com sucesso para a identificação de radioisótopos em ambientes experimentais reais não rotulados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

O artigo apresenta o MIRACL, um novo framework hierárquico de Meta-Aprendizado por Reforço Multi-Objetivo que utiliza decomposição de tarefas e adaptação baseada em Pareto para permitir generalização eficiente em poucos exemplos e superar métodos convencionais na otimização de cadeias de suprimentos multi-objetivo e multi-escalonadas.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

O artigo propõe o Score-Guided Proximal Projection (SGPP), uma estrutura geométrica unificada que reformula a edição e recuperação de imagens em modelos de Fluxo Retificado como um problema de otimização proximal, garantindo a convergência para o manifold de dados e generalizando métodos existentes ao oferecer um controle contínuo entre preservação de identidade e liberdade generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artigo propõe a Hipótese de Segurança Desentrelaçada (DSH), demonstrando que os mecanismos de segurança em Grandes Modelos de Linguagem operam em subespaços geométricos distintos para "saber" e "agir", o que permite a criação de ataques de evasão eficazes que separam o reconhecimento de conteúdo nocivo da recusa em respondê-lo.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artigo propõe um novo método de gradiente com comutação ponderada por softmax para otimização minimax estocástica distribuída com restrições estocásticas, que alcança complexidade de oráculo O(ϵ4)\mathcal{O}(\epsilon^{-4}) e garantias de convergência de alta probabilidade em cenários de participação parcial, superando limitações de abordagens tradicionais em tarefas como classificação de Neyman-Pearson e classificação justa.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artigo demonstra que as métricas tradicionais de coordenação em jogos multiagente são cegas à estrutura temporal e podem mascarar falhas graves na alternância, propondo novas métricas sensíveis ao tempo que revelam que políticas aprendidas podem performar significativamente pior do que o acaso, apesar de apresentarem altas recompensas agregadas.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG