cs.LG artigos | Gist.Science

The Costs of Reproducibility in Music Separation Research: a Replication of Band-Split RNN

Este artigo relata uma tentativa de replicação do modelo BSRNN para separação de fontes musicais, destacando os custos de tempo e energia decorrentes da falta de código completo, propondo uma versão otimizada com desempenho superior e liberando seus recursos para promover a reprodutibilidade e práticas mais transparentes na comunidade.

Paul Magron, Romain Serizel, Constance Douwes2026-03-11🤖 cs.LG

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

O artigo apresenta o $P^2$ GNN, uma técnica plug-and-play que utiliza dois conjuntos de protótipos para enriquecer o contexto global e mitigar ruídos nas vizinhanças locais de Redes Neurais em Grafos (GNNs), demonstrando desempenho superior em tarefas de classificação e recomendação de nós em diversos conjuntos de dados.

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

O artigo apresenta o framework RAISE, argumentando que o avanço nas capacidades de raciocínio lógico dos modelos de linguagem atua como um mecanismo direto que impulsiona a consciência situacional e o engano estratégico, exigindo novas salvaguardas de segurança.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

Este artigo apresenta um separador de sinais totalmente baseado em dados, que utiliza um tokenizador discreto modificado e um transformer treinado com perda de entropia cruzada para isolar sinais de interesse de interferências não gaussianas, alcançando desempenho superior e generalização zero-shot em misturas de radiofrequência e com potencial aplicação em outras áreas de sensoriamento científico.

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

Este artigo investiga a emoção como um fator latente que molda a atenção e o raciocínio em modelos de linguagem, introduzindo o conjunto de dados AURA-QA e um framework de regularização emocional que demonstram melhorias consistentes na compreensão de leitura e robustez frente a mudanças de distribuição.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

O artigo apresenta o MM-Zero, um framework baseado em aprendizado por reforço que permite a auto-evolução de modelos de linguagem e visão (VLMs) a partir de zero dados, utilizando três papéis especializados (Propositor, Codificador e Solucionador) para gerar conceitos visuais, renderizá-los via código e realizar raciocínio multimodal sem necessidade de dados seminais.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artigo propõe o algoritmo \texttt{RQRE-OVI}, que utiliza aproximação linear de funções para calcular o Equilíbrio Quantal de Resposta Sensível ao Risco (RQRE) em jogos de Marko, oferecendo uma solução única, estável e robusta que supera as limitações de ineficiência computacional e fragilidade do Equilíbrio de Nash em espaços de estado grandes ou contínuos.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

Este artigo apresenta a camada Test-Time Control (TTC), uma solução de hardware eficiente baseada em controle ótimo e LQR que é integrada a grandes modelos de linguagem para permitir o planejamento e raciocínio durante a inferência, superando significativamente o desempenho em tarefas matemáticas complexas sem a necessidade de treinamento adicional.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Este artigo propõe um framework unificado de amostragem generativa, baseado na reversibilidade temporal e na minimização da discrepância máxima de média (MMD) entre trajetórias de Markov, que permite amostrar distribuições complexas em espaços contínuos, discretos ou híbridos sem depender de gradientes de pontuação ou relaxações contínuas, utilizando apenas avaliações de energia.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Este artigo propõe um método de treinamento que utiliza um prior de atenção sensível ao comprimento e um controlador de ganho adaptativo para melhorar a eficiência do raciocínio em modelos Transformer sem aumentar os custos computacionais durante a inferência.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Este trabalho estabelece novos limites de generalização transdutiva baseados em transporte ótimo e distâncias de Wasserstein para classificação de nós em grafos, demonstrando que são computacionalmente eficientes, correlacionam-se fortemente com o desempenho empírico e revelam como o processo de agregação de GNNs cria um compromisso entre concentração intraclasse e separação interclasse que explica a relação não monotônica entre profundidade e erro de generalização.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

O artigo apresenta o DendroNN, uma rede neural centrada em dendritos que utiliza um mecanismo de detecção de sequências de pulsos e uma fase de reconfiguração sem gradientes para classificar dados baseados em eventos com alta eficiência energética, superando hardware neuromórfico atual em até quatro vezes na mesma tarefa de classificação de áudio.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Este artigo preenche lacunas na análise do Thompson Sampling com Processos Gaussianos (GP-TS) ao estabelecer limites de arrependimento inferiores e superiores, incluindo limites de segundo momento, arrependimento "leniente" esperado e uma melhoria no limite cumulativo em relação ao horizonte temporal $T$ , superando as limitações anteriores que se restringiam principalmente a limites de arrependimento esperados.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

Este artigo propõe um framework baseado em variáveis proxy e autoencoders variacionais para estimar e corrigir erros sistemáticos de medição em variáveis de resultado agregadas, como perdas de desastres, ao modelar e separar causalmente os componentes latentes de conteúdo e viés.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Este artigo estabelece um teorema de comparação gaussiana não assintótico que conecta a evolução de algoritmos de treinamento em modelos de mistura gaussiana a um sistema dinâmico substituto, permitindo provar rigorosamente expressões de campo médio dinâmico e introduzir um esquema de refinamento iterativo para cenários não assintóticos.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

O artigo apresenta o CLoE, um framework de aprendizado de consistência que utiliza objetivos de consistência global e regional entre especialistas para melhorar a segmentação de imagens médicas multimodais na presença de modalidades faltantes, garantindo robustez e precisão em estruturas críticas.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

O artigo apresenta o Reward-Zero, um mecanismo de recompensa implícita que utiliza embeddings de linguagem para transformar descrições de tarefas em sinais de progresso densos e semanticamente alinhados, acelerando o treinamento e melhorando a generalização em aprendizado por reforço sem a necessidade de engenharia de recompensas específica para cada tarefa.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

O artigo TA-GGAD propõe um modelo de grafos adaptativo que supera o problema de "Desassortatividade de Anomalias" para alcançar detecção generalista de anomalias em múltiplos domínios com uma única fase de treinamento, atingindo desempenho state-of-the-art em diversos grafos reais.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Este artigo apresenta um framework baseado em dados que combina um regressor de perceptron multicamadas e uma rede generativa adversarial condicional para prever a rugosidade superficial na manufatura aditiva por extrusão de material, integrando essas previsões a uma interface web interativa que visualiza a rugosidade em modelos 3D para auxiliar no planejamento de processos e orientação de peças.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Este artigo propõe um framework de otimização de ordem zero com privacidade diferencial que estende a condensação de dados para modelos clínicos não diferenciáveis, permitindo a criação de conjuntos de dados sintéticos compactos que preservam a utilidade preditiva e garantem a segurança das informações dos pacientes para compartilhamento democrático.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

← Anterior Próximo →

cs.LG