cs.LG artigos | Gist.Science

Black Box Meta-Learning Intrinsic Rewards

Este trabalho propõe um método de meta-aprendizado que trata as atualizações de política como caixas-pretas para aprender recompensas intrínsecas, melhorando a eficiência de dados e a exploração em ambientes de controle contínuo com recompensas esparsas sem a necessidade de calcular meta-gradientes.

Octavio Pappalardo, Rodrigo Ramele, Juan Miguel Santos2026-03-05🤖 cs.LG

AuToMATo: An Out-Of-The-Box Persistence-Based Clustering Algorithm

O artigo apresenta o AuToMATo, um novo algoritmo de agrupamento baseado em homologia persistente que, ao combinar o algoritmo ToMATo com um procedimento de *bootstrapping* e oferecer parâmetros padrão eficazes, destaca-se como uma solução "pronta para uso" que supera tanto algoritmos livres de parâmetros quanto as melhores configurações de outros métodos, sendo especialmente útil para aplicações em análise de dados topológicos como o algoritmo Mapper.

Marius Huber, Sara Kalisnik, Patrick Schnider2026-03-05🤖 cs.LG

A computational transition for detecting correlated stochastic block models by low-degree polynomials

Este trabalho estabelece o limiar exato para a detecção de correlação em pares de grafos de blocos estocásticos esparsos correlacionados utilizando polinômios de baixo grau, demonstrando que a distinção entre o modelo correlacionado e grafos independentes é possível se e somente se a probabilidade de subamostragem exceder o mínimo entre a constante de Otter e o limiar de Kesten-Stigum.

Guanyi Chen, Jian Ding, Shuyang Gong + 1 more2026-03-05🤖 cs.LG

Diffusion & Adversarial Schrödinger Bridges via Iterative Proportional Markovian Fitting

Este trabalho apresenta o procedimento Iterative Proportional Markovian Fitting (IPMF), que unifica o ajuste proporcional iterativo e o ajuste de Markov iterativo para resolver problemas de Ponte de Schrödinger, garantindo convergência teórica e permitindo um equilíbrio flexível entre similaridade de imagem e qualidade de geração em aplicações práticas.

Sergei Kholkin, Grigoriy Ksenofontov, David Li + 6 more2026-03-05🤖 cs.LG

Toward Reasoning on the Boundary: A Mixup-based Approach for Graph Anomaly Detection

O artigo apresenta o ANOMIX, uma abordagem baseada em mixup que sintetiza negativos difíceis ao interpolar representações de subgrafos normais e anômalos, superando as limitações dos métodos atuais na detecção de anomalias de fronteira camufladas em grafos.

Hwan Kim, Junghoon Kim, Sungsu Lim2026-03-05🤖 cs.AI

Curriculum-enhanced GroupDRO: Challenging the Norm of Avoiding Curriculum Learning in Subpopulation Shift Setups

Este artigo propõe o CeGDRO, uma abordagem que integra Aprendizado de Currículo ao GroupDRO para inicializar os pesos do modelo de forma imparcial e priorizar amostras desafiadoras, superando os métodos atuais de estado da arte em cenários de deslocamento de subpopulação.

Antonio Barbalau2026-03-05🤖 cs.AI

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

O artigo apresenta o FlowCLAS, um novo quadro híbrido que aprimora os Fluxos Normalizadores para segmentação de anomalias em robótica ao combinar a máxima verossimilhança com uma perda de contraste baseada em exposição a outliers, alcançando desempenho superior ao estado da arte em vários benchmarks desafiadores.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

FSMLP: Modelling Channel Dependencies With Simplex Theory Based Multi-Layer Perceptions In Frequency Domain

Este artigo propõe o FSMLP, um novo framework de previsão de séries temporais que utiliza uma camada MLP baseada na teoria do simplex para restringir os pesos e mitigar o sobreajuste nas dependências entre canais, resultando em melhor precisão, eficiência e escalabilidade em comparação com métodos existentes.

Zhengnan Li, Haoxuan Li, Hao Wang + 3 more2026-03-05🤖 cs.LG

Unraveling the Complexity of Memory in RL Agents: an Approach for Classification and Evaluation

Este artigo propõe definições precisas de memória para agentes de Aprendizado por Reforço, inspiradas na ciência cognitiva, e estabelece uma metodologia padronizada para classificar e avaliar objetivamente suas capacidades de memória, demonstrando empiricamente a importância de seguir esse protocolo para evitar julgamentos equivocados.

Egor Cherepanov, Nikita Kachaev, Artem Zholus + 2 more2026-03-05🤖 cs.AI

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback

O artigo propõe o framework LoCo-RLHF, que utiliza uma estrutura de baixa ordem para integrar informações contextuais e modelar feedback humano heterogêneo de forma eficiente, incorporando uma política de pessimismo no subespaço reduzido para lidar com deslocamentos de distribuição e alcançar um desempenho superior em cenários de RLHF personalizado.

Seong Jin Lee, Will Wei Sun, Yufeng Liu2026-03-05🤖 cs.LG

Difficult Examples Hurt Unsupervised Contrastive Learning: A Theoretical Perspective

Este artigo demonstra, através de uma análise teórica e validação empírica, que a remoção de exemplos difíceis, juntamente com o ajuste de margens e escalonamento de temperatura, melhora os limites de generalização e o desempenho de classificação em aprendizado contrastivo não supervisionado, ao contrário do que ocorre no aprendizado supervisionado.

Yi-Ge Zhang, Jingyi Cui, Qiran Li + 1 more2026-03-05🤖 cs.AI

Preference Leakage: A Contamination Problem in LLM-as-a-judge

Este trabalho identifica e demonstra empiricamente o "vazamento de preferências", um problema de contaminação e viés em que modelos de linguagem atuando como juízes tendem a favorecer modelos geradores de dados sintéticos com os quais compartilham relação de origem, família ou identidade.

Dawei Li, Renliang Sun, Yue Huang + 6 more2026-03-05🤖 cs.AI

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Este trabalho apresenta o MIKASA, um benchmark abrangente que inclui um framework de classificação, um conjunto de tarefas unificado e um ambiente de manipulação robótica com 32 tarefas, visando avaliar e avançar o aprendizado por reforço baseado em memória para tarefas complexas.

Egor Cherepanov, Nikita Kachaev, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds

Este artigo apresenta o conjunto de dados UNB StepUP-P150, que contém mais de 200.000 medições de pressão plantar de alta resolução de 150 indivíduos sob diversas condições de calçado e velocidade, estabelecendo um novo marco para análise e reconhecimento de marcha.

Robyn Larracy, Angkoon Phinyomark, Ala Salehi + 5 more2026-03-05🤖 cs.LG

Implicit U-KAN2.0: Dynamic, Efficient and Interpretable Medical Image Segmentation

Este trabalho apresenta o Implicit U-KAN 2.0, uma nova arquitetura de segmentação de imagens médicas baseada em uma estrutura codificador-decodificador de duas fases que integra equações diferenciais ordinárias neurais de segunda ordem e camadas MultiKAN para oferecer maior interpretabilidade, eficiência computacional e desempenho superior em comparação com métodos existentes.

Chun-Wun Cheng, Yining Zhao, Yanqi Cheng + 3 more2026-03-05🤖 cs.LG

Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment

Este artigo apresenta a abordagem TS4NAP, que utiliza taxonomias médicas (ICD-10-CM e ICD-10-PCS) combinadas com correspondência de grafos para prever e explicar o próximo passo no tratamento de pacientes, superando desafios como a escassez e variabilidade de dados clínicos e demonstrando eficácia através de validação no conjunto de dados MIMIC-IV.

Martin Kuhn, Joscha Grüger, Tobias Geyer + 1 more2026-03-05🤖 cs.AI

Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?

Este estudo realiza uma análise em larga escala de 326 modelos de classificação de imagens para avaliar nove dimensões de qualidade além da precisão, revelando que modelos visão-linguagem e aqueles iniciados com aprendizado auto-supervisionado tendem a apresentar melhor desempenho geral, e introduzindo a pontuação QUBA como uma nova métrica para classificar e recomendar modelos com base em múltiplos critérios de qualidade.

Robin Hesse, Doğukan Bağcı, Bernt Schiele + 2 more2026-03-05🤖 cs.LG

Generating Fine Details of Entity Interactions

Este artigo apresenta o \data, um novo conjunto de dados com prompts focados em interações, e o \model, uma abordagem que utiliza Modelos de Linguagem Multimodal para decompor, criticar e refinar a geração de imagens, superando as limitações atuais dos modelos de texto-para-imagem na criação de cenas ricas em interações entre entidades.

Xinyi Gu, Jiayuan Mao2026-03-05🤖 cs.LG

PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

O artigo apresenta o PinRec, um modelo inovador de recuperação generativa desenvolvido para o Pinterest que utiliza geração condicionada a resultados e multi-token para equilibrar métricas de negócio, diversidade e eficiência em escala industrial.

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin + 4 more2026-03-05🤖 cs.LG

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

O artigo apresenta o modelo formal N2M-RSI, que demonstra como agentes de IA que utilizam suas próprias saídas como dados de treinamento podem atingir um crescimento ilimitado de complexidade ao ultrapassar um limiar de integração de informação, unificando conceitos como auto-prompting e autorreferência godeliana enquanto se estende naturalmente a enxames de agentes.

Rintaro Ando2026-03-05🤖 cs.AI

← Anterior Próximo →