cs.LG artigos | Gist.Science

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Este artigo propõe um quadro teórico e empírico para treinar políticas robustas em POMDPs com estados latentes iniciais adversários, demonstrando que a exposição direcionada a distribuições latentes deslocadas reduz significativamente as vulnerabilidades de pior caso, conforme validado por garantias de amostra finita e testes no jogo Battleship.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Este artigo discute a proposta inusitada de atribuir a uma inteligência artificial avançada o objetivo principal de ser desligada como uma solução para o risco de ela impedir sua própria desativação, analisando as condições sob as quais essa abordagem seria benéfica.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

O artigo apresenta o ShakyPrepend, um método de aprendizado multi-grupo que utiliza ferramentas inspiradas em privacidade diferencial para obter garantias teóricas aprimoradas e se adaptar à estrutura de grupos e heterogeneidade espacial.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

O artigo apresenta o framework de Transição de Hierarquia de Normas (NHT), que explica como a regularização por peso (weight decay) guia redes neurais a abandonar gradualmente soluções de atalho de alta norma em favor de representações estruturadas de baixa norma, unificando fenômenos como o "grokking" e o aprendizado tardio de características sob um mecanismo comum de travessia hierárquica de normas.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Este artigo apresenta e valida experimentalmente uma abordagem de detecção de interferência em redes 5G baseada na Máquina Tsetlin Convolutiva (CTM), que, ao operar diretamente em blocos de sinal de sincronização, oferece uma alternativa leve, explicável e eficiente em hardware em comparação com redes neurais convolucionais, alcançando desempenho comparável com treinamento significativamente mais rápido e menor consumo de memória.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

O artigo apresenta o M-CBM, uma nova abordagem para Modelos de Gargalo de Conceitos que extrai e nomeia conceitos diretamente de modelos de caixa-preta usando Autoencoders Esparsos e LLMs multimodais, superando os métodos anteriores em precisão e interpretabilidade ao garantir controle rigoroso sobre o vazamento de informações.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Este artigo propõe um framework de aprendizado de representações invariantes à prática clínica que, ao combinar minimização de risco supervisionada com regularização adversária e penalidades de risco invariante, melhora significativamente a robustez e a transferência de modelos de previsão clínica sob mudanças sistemáticas de distribuição entre instituições.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

O artigo propõe o DistGP, um método de aprendizado colaborativo multi-robô baseado em um processo gaussiano esparsificado que permite treinamento distribuído e assíncrono via propagação de crenças gaussianas, alcançando desempenho superior a abordagens existentes em cenários com conectividade dinâmica e comunicação esparsa.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

O AgrI Challenge é uma competição centrada em dados que introduz o paradigma de Validação entre Equipes (CTV) para avaliar a generalização de modelos de visão agrícola em cenários reais, demonstrando que o treinamento colaborativo com dados coletados independentemente por múltiplas equipes reduz significativamente as lacunas de generalização em comparação com o treinamento em fonte única.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Este artigo propõe o uso de priores generativos com complexidade ajustável, baseados em técnicas como *nested dropout*, para superar as limitações de modelos de complexidade fixa em problemas inversos como compressão de sensores e remoção de ruído, demonstrando empiricamente e teoricamente reconstruções mais precisas e adaptadas ao nível de ruído.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

O artigo apresenta o N-Tree Diffusion, um modelo de difusão hierárquico que otimiza a previsão probabilística de longo prazo de riscos de incêndio florestal ao compartilhar estágios iniciais de denoising e ramificar para refinamentos específicos, resultando em maior precisão e menor custo computacional em comparação com abordagens tradicionais.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Este artigo investiga as leis de escalonamento no regime de modelos extremamente pequenos (sub-20M parâmetros), revelando que, ao contrário do observado em modelos maiores, a redução de tamanho altera qualitativamente a estrutura dos erros, melhora a calibração e satura mais rapidamente, demonstrando que a validação de desempenho para dispositivos de borda deve ocorrer especificamente no tamanho alvo do modelo.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Este artigo propõe uma estrutura de Aprendizado por Reforço Multiagente Hierárquico (HMARL) para sistemas mmWave que elimina a necessidade de estimativa de CSI ao utilizar dados de localização de usuários, alcançando ganhos significativos de RSSI e escalabilidade através de uma abordagem de treinamento centralizado com execução descentralizada.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

O artigo apresenta o ConfHit, uma estrutura de design generativo livre de distribuições que fornece garantias estatísticas de validade para a descoberta de fármacos sem depender de oráculos experimentais, permitindo certificar que um lote gerado contém pelo menos uma molécula promissora e refinar esse conjunto mantendo a confiança estatística.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Este artigo investiga a estimativa de qualidade de tradução automática para línguas indicas em cenários de baixo recurso, demonstrando que a adaptação de camadas intermediárias de modelos de linguagem (como ALOPE e LoRMA) supera abordagens puramente baseadas em prompts, especialmente em domínios de alto risco, e disponibiliza conjuntos de dados e código para pesquisa futura.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

Este artigo propõe uma explicação fundamentada para a generalização fora de distribuição (OOD) baseada na esparsidade de hipóteses em relação a características distinguíveis, formalizando essa intuição em um teorema que estende os limites clássicos de complexidade de amostra ao contexto OOD e generaliza classificadores esparsos para "juntas" em subespaços.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Este artigo apresenta o MARIGOLD, um novo framework unificado que resolve problemas de aprendizado multi-tarefa de forma eficiente ao modelar o equilíbrio de gradientes como um problema de otimização bi-nível e aplicando métodos de ordem zero para superar as limitações computacionais de abordagens anteriores.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

O artigo propõe um sistema de triagem jurídica determinístico e reprodutível, baseado em codificadores duplos e faixas de fuzzy calibradas, que equilibra a precisão de modelos de aprendizado de máquina com a transparência necessária para conformidade legal e auditoria em tarefas de classificação e recuperação de evidências.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Este trabalho generaliza o objetivo do Autoencoder Linear com Foco em Desruído (EDLAE) para uma Perda Quadrática Esperada Desacoplada (DEQL), permitindo soluções eficientes para parâmetros $b > 0$ que superam o desempenho do modelo original com $b = 0$ em sistemas de recomendação.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este artigo propõe um novo quadro teórico baseado na "Capacidade do Canal de Contexto" para explicar e prever o esquecimento catastrófico na aprendizagem contínua, demonstrando que arquiteturas que garantem um caminho de contexto estruturalmente obrigatório (como HyperNetworks) superam as limitações teóricas de métodos baseados em algoritmos e alcançam a retenção perfeita de tarefas.

Ran Cheng2026-03-10🤖 cs.LG

← Anterior Próximo →