cs.LG artigos | Gist.Science

Identifying Adversary Characteristics from an Observed Attack

Este artigo propõe e demonstra um framework para identificar as características do atacante a partir de um ataque observado, provando que a identificação é impossível sem conhecimento adicional e oferecendo uma abordagem agnóstica ao domínio para determinar o provável agressor, o que permite tanto a mitigação exógena quanto a melhoria do desempenho de métodos de defesa diretos.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Este artigo propõe o Interpolated FID (iFID), uma métrica simples baseada na interpolação no espaço latente que supera o FID de reconstrução tradicional ao demonstrar uma forte correlação com a qualidade de geração de modelos de difusão latente, permitindo prever com precisão o desempenho desses modelos.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Este artigo propõe a Contagem Implícita de Erros (IEC), uma abordagem de aprendizado por reforço sem referência que enumera e pondera erros em vez de verificar acertos contra um gabarito, demonstrando sua superioridade em tarefas de "virtual try-on" onde múltiplas respostas válidas tornam a geração de rubricas tradicional inviável.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

The Value of Graph-based Encoding in NBA Salary Prediction

Este artigo demonstra que a incorporação de dados de desempenho em uma representação vetorial derivada de um grafo de conhecimento melhora significativamente a precisão dos modelos de aprendizado supervisionado na previsão de salários de jogadores veteranos da NBA, superando as limitações das abordagens tradicionais baseadas apenas em dados tabulares.

Junhao Su, David Grimsman, Christopher Archibald2026-03-09🤖 cs.LG

Reinforcement Learning for Power-Flow Network Analysis

Este artigo propõe o uso de aprendizado por reforço com uma função de recompensa probabilística para projetar instâncias de equações de fluxo de potência que possuem um número de soluções reais significativamente maior do que a média, superando as limitações dos algoritmos algébricos atuais na análise de redes elétricas complexas.

Alperen Ergur, Julia Lindberg, Vinny Miller2026-03-09🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Este artigo demonstra que, no contexto de regressão de crista com características aleatórias, é possível obter leis de escala significativamente melhores ao treinar um modelo forte com rótulos imperfeitos de um modelo fraco, permitindo que o aluno atinja taxas de erro ótimas mesmo quando o professor não apresenta melhoria com o aumento dos dados.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Este artigo investiga estratégias de paralelização para a implantação de modelos de linguagem densos, demonstrando que o Paralelismo de Tensores (TP) otimiza a latência enquanto o Paralelismo de Pipeline (PP) favorece a vazão, e que a combinação híbrida dessas técnicas permite gerenciar eficazmente o compromisso entre esses dois indicadores de desempenho.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Warm Starting State-Space Models with Automata Learning

Este artigo demonstra que máquinas de Moore podem ser realizadas como modelos de espaço de estado (SSMs), propondo uma abordagem híbrida que utiliza o aprendizado de autômatos simbólicos para inicializar SSMs, resultando em uma convergência 2 a 5 vezes mais rápida e maior precisão em comparação com inicializações aleatórias.

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Este artigo estabelece um framework geométrico baseado em fibrados principais para analisar as limitações fundamentais e as oportunidades na aprendizagem de equações diferenciais que governam a evolução de redes temporais modeladas por Grafos de Produto Aleatório (RDPGs), demonstrando como a estrutura dinâmica pode resolver ambiguidades de gauge e unificando a dificuldade geométrica com a estatística através de lacunas espectrais.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

O artigo alerta que a rápida adoção da IA na ciência climática, embora prometa avanços, corre o risco de ampliar a desigualdade global ao concentrar infraestrutura e dados no Norte Global, exigindo uma mudança de paradigma para uma abordagem centrada em dados, infraestrutura digital pública e co-produção de conhecimento para garantir equidade e resiliência sistêmica.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Este estudo demonstra que a adaptação de domínio não supervisionada, especificamente através da minimização da discrepância máxima de momento (MMD), permite que modelos de aprendizado de máquina treinados em dados sintéticos de espectroscopia gama generalizem com sucesso para a identificação de radioisótopos em ambientes experimentais reais não rotulados.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

Este artigo demonstra que, ao analisar a taxa de vitória em vez da recompensa esperada, a amostragem Best-of-N (BoN) é estatisticamente ótima para alinhamento em tempo de inferência e propõe uma variante prática que elimina o "reward hacking" mantendo essa otimalidade.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

Full Dynamic Range Sky-Modelling For Image Based Lighting

O artigo apresenta o Icarus, um modelo de céu para todas as condições meteorológicas baseado em aprendizado profundo que gera mapas de ambiente de Alto Alcance Dinâmico (HDR) com alta precisão fotorealista, superando as limitações atuais na modelagem da região solar e permitindo o controle interativo de formações solares e de nuvens para Iluminação Baseada em Imagem (IBL).

Ian J. Maquignaz2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

O artigo apresenta o MIRACL, um novo framework hierárquico de Meta-Aprendizado por Reforço Multi-Objetivo que utiliza decomposição de tarefas e adaptação baseada em Pareto para permitir generalização eficiente em poucos exemplos e superar métodos convencionais na otimização de cadeias de suprimentos multi-objetivo e multi-escalonadas.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

O artigo propõe o Score-Guided Proximal Projection (SGPP), uma estrutura geométrica unificada que reformula a edição e recuperação de imagens em modelos de Fluxo Retificado como um problema de otimização proximal, garantindo a convergência para o manifold de dados e generalizando métodos existentes ao oferecer um controle contínuo entre preservação de identidade e liberdade generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

Este artigo apresenta o TML-Bench, um novo benchmark para avaliar agentes de ciência de dados autônomos em tarefas de aprendizado de máquina tabular baseadas em competições do Kaggle, demonstrando que o modelo MiniMax-M2.1 obteve o melhor desempenho agregado entre os 10 modelos de linguagem de código aberto testados sob diferentes limites de tempo.

Mykola Pinchuk2026-03-09🤖 cs.AI

Bridging Domains through Subspace-Aware Model Merging

O artigo propõe o método SCORE, que resolve conflitos de subespaço entre modelos treinados em domínios distintos ao projetá-los em uma base ortogonal compartilhada, melhorando significativamente a generalização de domínio em tarefas de fusão de modelos.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

Este artigo propõe a Hipótese de Segurança Desentrelaçada (DSH), demonstrando que os mecanismos de segurança em Grandes Modelos de Linguagem operam em subespaços geométricos distintos para "saber" e "agir", o que permite a criação de ataques de evasão eficazes que separam o reconhecimento de conteúdo nocivo da recusa em respondê-lo.

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

First-Order Softmax Weighted Switching Gradient Method for Distributed Stochastic Minimax Optimization with Stochastic Constraints

Este artigo propõe um novo método de gradiente com comutação ponderada por softmax para otimização minimax estocástica distribuída com restrições estocásticas, que alcança complexidade de oráculo $\mathcal{O}(\epsilon^{-4})$ e garantias de convergência de alta probabilidade em cenários de participação parcial, superando limitações de abordagens tradicionais em tarefas como classificação de Neyman-Pearson e classificação justa.

Zhankun Luo, Antesh Upadhyay, Sang Bin Moon, Abolfazl Hashemi2026-03-09🤖 cs.LG

The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes

Este artigo demonstra que as métricas tradicionais de coordenação em jogos multiagente são cegas à estrutura temporal e podem mascarar falhas graves na alternância, propondo novas métricas sensíveis ao tempo que revelam que políticas aprendidas podem performar significativamente pior do que o acaso, apesar de apresentarem altas recompensas agregadas.

Nikolaos Al. Papadopoulos, Konstantinos Psannis2026-03-09🤖 cs.LG

← Anterior Próximo →