cs.LG artigos | Gist.Science

Fast and Flexible Audio Bandwidth Extension via Vocos

Este artigo apresenta um modelo de extensão de largura de banda baseado no Vocos que gera conteúdo de alta frequência ausente em áudio de 8 a 48 kHz com qualidade competitiva e eficiência extrema, alcançando taxas de processamento em tempo real de 0,0001 em GPU e 0,0053 em CPU.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Este artigo propõe uma nova abordagem para a descoberta de simetrias contínuas que, em vez de otimizar geradores de transformação, identifica padrões de esparsidade estruturada no domínio espectral obtido por meio da Transformada de Fourier Generalizada, demonstrando sua eficácia em tarefas como o pêndulo duplo e a classificação de quarks top.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

O artigo apresenta o AutoResearch-RL, um framework de aprendizado por reforço que permite a agentes autônomos descobrirem e aprimorarem continuamente arquiteturas de redes neurais e hiperparâmetros sem supervisão humana, alcançando desempenho superior ou equivalente ao de configurações ajustadas manualmente em um único GPU após cerca de 300 iterações.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Este artigo propõe um novo framework de previsão de rendimento de culturas em nível de condado que combina um modelo de base multi-escala para capturar dinâmicas temporais de curto e longo prazo com uma estratégia de adaptação baseada em recuperação para melhorar a generalização espacial, superando assim as limitações de métodos existentes em grandes regiões.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

O artigo apresenta o StructSAM, um framework de fusão e recuperação de tokens que preserva a estrutura e o espectro para otimizar os modelos Segment Anything (SAM), reduzindo significativamente o custo computacional sem comprometer a precisão nas bordas e nas regiões de prompt.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Este artigo propõe um quadro teórico e empírico para treinar políticas robustas em POMDPs com estados latentes iniciais adversários, demonstrando que a exposição direcionada a distribuições latentes deslocadas reduz significativamente as vulnerabilidades de pior caso, conforme validado por garantias de amostra finita e testes no jogo Battleship.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Este artigo discute a proposta inusitada de atribuir a uma inteligência artificial avançada o objetivo principal de ser desligada como uma solução para o risco de ela impedir sua própria desativação, analisando as condições sob as quais essa abordagem seria benéfica.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

O artigo apresenta o ShakyPrepend, um método de aprendizado multi-grupo que utiliza ferramentas inspiradas em privacidade diferencial para obter garantias teóricas aprimoradas e se adaptar à estrutura de grupos e heterogeneidade espacial.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

O artigo apresenta o framework de Transição de Hierarquia de Normas (NHT), que explica como a regularização por peso (weight decay) guia redes neurais a abandonar gradualmente soluções de atalho de alta norma em favor de representações estruturadas de baixa norma, unificando fenômenos como o "grokking" e o aprendizado tardio de características sob um mecanismo comum de travessia hierárquica de normas.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Este artigo apresenta e valida experimentalmente uma abordagem de detecção de interferência em redes 5G baseada na Máquina Tsetlin Convolutiva (CTM), que, ao operar diretamente em blocos de sinal de sincronização, oferece uma alternativa leve, explicável e eficiente em hardware em comparação com redes neurais convolucionais, alcançando desempenho comparável com treinamento significativamente mais rápido e menor consumo de memória.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

O artigo apresenta o M-CBM, uma nova abordagem para Modelos de Gargalo de Conceitos que extrai e nomeia conceitos diretamente de modelos de caixa-preta usando Autoencoders Esparsos e LLMs multimodais, superando os métodos anteriores em precisão e interpretabilidade ao garantir controle rigoroso sobre o vazamento de informações.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Este artigo propõe um framework de aprendizado de representações invariantes à prática clínica que, ao combinar minimização de risco supervisionada com regularização adversária e penalidades de risco invariante, melhora significativamente a robustez e a transferência de modelos de previsão clínica sob mudanças sistemáticas de distribuição entre instituições.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

O artigo propõe o DistGP, um método de aprendizado colaborativo multi-robô baseado em um processo gaussiano esparsificado que permite treinamento distribuído e assíncrono via propagação de crenças gaussianas, alcançando desempenho superior a abordagens existentes em cenários com conectividade dinâmica e comunicação esparsa.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

O AgrI Challenge é uma competição centrada em dados que introduz o paradigma de Validação entre Equipes (CTV) para avaliar a generalização de modelos de visão agrícola em cenários reais, demonstrando que o treinamento colaborativo com dados coletados independentemente por múltiplas equipes reduz significativamente as lacunas de generalização em comparação com o treinamento em fonte única.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Este artigo propõe o uso de priores generativos com complexidade ajustável, baseados em técnicas como *nested dropout*, para superar as limitações de modelos de complexidade fixa em problemas inversos como compressão de sensores e remoção de ruído, demonstrando empiricamente e teoricamente reconstruções mais precisas e adaptadas ao nível de ruído.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

O artigo apresenta o N-Tree Diffusion, um modelo de difusão hierárquico que otimiza a previsão probabilística de longo prazo de riscos de incêndio florestal ao compartilhar estágios iniciais de denoising e ramificar para refinamentos específicos, resultando em maior precisão e menor custo computacional em comparação com abordagens tradicionais.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Este artigo investiga as leis de escalonamento no regime de modelos extremamente pequenos (sub-20M parâmetros), revelando que, ao contrário do observado em modelos maiores, a redução de tamanho altera qualitativamente a estrutura dos erros, melhora a calibração e satura mais rapidamente, demonstrando que a validação de desempenho para dispositivos de borda deve ocorrer especificamente no tamanho alvo do modelo.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Este artigo propõe uma estrutura de Aprendizado por Reforço Multiagente Hierárquico (HMARL) para sistemas mmWave que elimina a necessidade de estimativa de CSI ao utilizar dados de localização de usuários, alcançando ganhos significativos de RSSI e escalabilidade através de uma abordagem de treinamento centralizado com execução descentralizada.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

O artigo apresenta o ConfHit, uma estrutura de design generativo livre de distribuições que fornece garantias estatísticas de validade para a descoberta de fármacos sem depender de oráculos experimentais, permitindo certificar que um lote gerado contém pelo menos uma molécula promissora e refinar esse conjunto mantendo a confiança estatística.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Este artigo investiga a estimativa de qualidade de tradução automática para línguas indicas em cenários de baixo recurso, demonstrando que a adaptação de camadas intermediárias de modelos de linguagem (como ALOPE e LoRMA) supera abordagens puramente baseadas em prompts, especialmente em domínios de alto risco, e disponibiliza conjuntos de dados e código para pesquisa futura.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

← Anterior Próximo →