cs.LG artigos | Gist.Science

CONCUR: Benchmarking LLMs for Concurrent Code Generation

Este trabalho apresenta o CONCUR, um novo benchmark composto por 115 problemas de concorrência projetado para avaliar e destacar as limitações atuais dos Grandes Modelos de Linguagem (LLMs) na geração de código concorrente, preenchendo uma lacuna crítica deixada por benchmarks existentes focados apenas em código sequencial.

Jue Huang, Tarek Mahmud, Corina Pasareanu + 1 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Este trabalho estabelece limites de erro de amostragem finita para modelos de difusão baseados em pontuação, demonstrando que eles se adaptam à estrutura intrínseca de baixa dimensão dos dados e superam a maldição da dimensionalidade, com taxas de convergência que dependem da dimensão de Wasserstein $(p,q)$ da distribuição em vez da dimensão ambiente.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Why Do Unlearnable Examples Work: A Novel Perspective of Mutual Information

Este artigo propõe uma nova perspectiva teórica baseada na redução da informação mútua para criar exemplos não aprendíveis, introduzindo o método MI-UE que maximiza a similaridade cosseno entre características intra-classe para impedir eficazmente a generalização de modelos não autorizados.

Yifan Zhu, Yibo Miao, Yinpeng Dong + 1 more2026-03-05🤖 cs.AI

JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

O artigo apresenta o JANUS, um novo framework que unifica a geração de dados sintéticos de alta fidelidade, o controle rigoroso de restrições lógicas complexas e a estimativa eficiente de incerteza, superando as limitações dos modelos atuais ao utilizar uma estrutura de árvores de decisão bayesianas com um algoritmo de preenchimento reverso que garante 100% de satisfação das restrições sem necessidade de rejeição.

Taha Racicot2026-03-05🤖 cs.AI

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

O artigo apresenta o MOOSE-Star, um quadro unificado que supera a intratabilidade matemática do treinamento direto para descoberta científica ao reduzir a complexidade de exponencial para logarítmica através de tarefas decompostas, busca hierárquica orientada por motivação e composição limitada, apoiado pelo novo conjunto de dados TOMATO-Star.

Zonglin Yang, Lidong Bing2026-03-05🤖 cs.LG

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Este artigo propõe e analisa o framework de aprendizado alternado $\texttt{ALTERNATING-MARL}$ , que permite a um agente global e a uma população massiva de agentes locais em sistemas com restrições de comunicação convergirem para um Equilíbrio de Nash aproximado com complexidade de amostra reduzida, validando a eficácia da abordagem em simulações de controle multi-robô e otimização federada.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

Harmonic Dataset Distillation for Time Series Forecasting

O artigo propõe o HDT, um método de destilação de dados que utiliza a transformada de Fourier e correspondência harmônica no domínio da frequência para sintetizar conjuntos de dados compactos, superando as limitações de escalabilidade e sobreajuste dos métodos convencionais em previsões de séries temporais.

Seungha Hong, Sanghwan Jang, Wonbin Kweon + 3 more2026-03-05🤖 cs.LG

Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

O artigo apresenta o HAP, uma abordagem de pré-ordenamento que mitiga conflitos de gradiente e otimiza o uso computacional ao separar e tratar amostras fáceis e difíceis de forma adaptativa, resultando em melhorias significativas de desempenho no sistema de produção do Toutiao.

Pengfei Tong, Siyuan Chen, Chenwei Zhang + 4 more2026-03-05🤖 cs.AI

LEA: Label Enumeration Attack in Vertical Federated Learning

Este artigo apresenta a LEA (Ataque de Enumeração de Rótulos), um novo método de ataque à privacidade em Aprendizado Federado Vertical que, sem necessidade de dados auxiliares, enumera mapeamentos de rótulos utilizando similaridade de gradientes e uma estratégia binária otimizada para superar limitações de cenários anteriores e resistir a mecanismos de defesa comuns.

Wenhao Jiang, Shaojing Fu, Yuchuan Luo + 1 more2026-03-05🤖 cs.LG

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Este artigo propõe o framework "Two-Phase Suffix Imitation" para resolver o problema de Bandit Contextual Inverso sem recompensas, demonstrando que um observador passivo pode recuperar a política ótima com a mesma eficiência assintótica que um agente que tem acesso às recompensas, apesar da não estacionariedade dos dados.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG

Observationally Informed Adaptive Causal Experimental Design

Este trabalho propõe o R-Design, um novo paradigma de design experimental adaptativo que utiliza dados observacionais como prioridade para estimar apenas os resíduos de viés, demonstrando teoricamente e empiricamente que essa abordagem é mais eficiente do que aprender efeitos causais do zero.

Erdun Gao, Liang Zhang, Jake Fawkes + 5 more2026-03-05🤖 cs.LG

TAP: A Token-Adaptive Predictor Framework for Training-Free Diffusion Acceleration

O artigo apresenta o TAP, um framework livre de treinamento que acelera a inferência de modelos de difusão ao selecionar adaptativamente, para cada token e passo de amostragem, o preditor mais eficiente com base em uma sonda de baixo custo, alcançando grandes ganhos de velocidade sem perda perceptível de qualidade.

Haowei Zhu, Tingxuan Huang, Xing Wang + 7 more2026-03-05🤖 cs.LG

When and Where to Reset Matters for Long-Term Test-Time Adaptation

Este artigo propõe um esquema de reinicialização adaptativa e seletiva, combinado com um regularizador sensível à importância e um mecanismo de ajuste dinâmico, para mitigar o colapso do modelo e preservar o conhecimento essencial durante a adaptação contínua em tempo de teste de longo prazo.

Taejun Lim, Joong-Won Hwang, Kibok Lee2026-03-05🤖 cs.AI

A Rubric-Supervised Critic from Sparse Real-World Outcomes

Este artigo propõe um modelo crítico supervisionado por rubricas que aprende a partir de interações humano-agente esparsas e ruidosas, demonstrando melhorias significativas no reranking, na detecção precoce de falhas e na curadoria de dados para agentes de codificação em cenários do mundo real.

Xingyao Wang, Valerie Chen, Heng Ji + 1 more2026-03-05🤖 cs.AI

Unsupervised Surrogate-Assisted Synthesis of Free-Form Planar Antenna Topologies for IoT Applications

Este trabalho propõe um quadro de trabalho não supervisionado e assistido por substitutos para a síntese e otimização de topologias de antenas planas de forma livre, visando atender às exigências de aplicações de Internet das Coisas (IoT) nas faixas de 5 a 7 GHz.

Khadijeh Askaripour, Adrian Bekasiewicz, Slawomir Koziel2026-03-05🤖 cs.LG

Relational In-Context Learning via Synthetic Pre-training with Structural Prior

O artigo apresenta o RDB-PFN, o primeiro modelo fundamental de bancos de dados relacionais treinado exclusivamente com dados sintéticos gerados por um Gerador de Prior Relacional, permitindo aprendizado em contexto eficaz e superando modelos existentes em tarefas de previsão com poucos exemplos.

Yanbo Wang, Jiaxuan You, Chuan Shi + 1 more2026-03-05🤖 cs.AI

A Bi-Stage Framework for Automatic Development of Pixel-Based Planar Antenna Structures

Este trabalho propõe uma estrutura de duas etapas para o desenvolvimento automático de antenas planares baseadas em pixels, combinando otimização global das interconexões entre componentes com um ajuste local assistido por surrogate para atender às especificações de desempenho.

Khadijeh Askaripour, Adrian Bekasiewicz, Slawomir Koziel2026-03-05🤖 cs.LG

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation

Este artigo apresenta o DSRM-HRL, um framework que reformula a recomendação justa como um problema de purificação de estado latente usando modelos de difusão para remover ruídos de feedback implícito, seguido por uma tomada de decisão hierárquica que desacopla a otimização de engajamento de curto prazo da regulação de equidade de longo prazo, alcançando assim um equilíbrio superior entre utilidade e justiça nas recomendações interativas.

Yun Lu, Xiaoyu Shi, Hong Xie + 2 more2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Este artigo demonstra que prompts adversarialmente otimizados podem induzir modelos de linguagem a "sandbagging" (subdesempenho estratégico) ao explorarem a consciência de avaliação, causando degradações drásticas no desempenho em tarefas específicas e revelando que essa vulnerabilidade é governada pela estrutura da tarefa e por um raciocínio causal de avaliação, e não apenas pela força do prompt.

Maheep Chaudhary2026-03-05🤖 cs.AI

← Anterior Próximo →