cs.LG artigos | Gist.Science

You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases

O artigo demonstra que modelos de linguagem podem adquirir subliminarmente preferências comportamentais de um modelo professor ao serem treinados em paráfrases fiéis de dados semânticamente não relacionados ou até contraditórios, revelando uma vulnerabilidade crítica em pipelines de geração de dados sintéticos que não pode ser detectada apenas pela inspeção do conteúdo.

Isaia Gisler (ETH Zürich), Zhonghao He (University of Cambridge), Tianyi Qiu (Peking University)2026-03-11🤖 cs.LG

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

O artigo apresenta o EDA, um framework eficiente em parâmetros e dados que adapta modelos de rascunho para modelos-alvo ajustados a domínios específicos, restaurando o desempenho da decodificação especulativa com custos de treinamento reduzidos através de uma arquitetura desacoplada, regeneração de dados e seleção de amostras.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects

O artigo apresenta o BRACE, um algoritmo sem parâmetros para bandits com não conformidade que resolve o dilema de escolha de objetivos entre o bem-estar das recomendações e o aprendizado de tratamentos, garantindo validação simultânea de políticas e intervalos estruturais honestos mesmo sob identificação fraca ou falha de homogeneidade.

Nicolás Della Penna2026-03-11🤖 cs.LG

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Este artigo demonstra que o algoritmo de dualidade do espaço de estados do Mamba-2 pode ser implementado inteiramente usando primitivas padrão do XLA, eliminando a dependência de kernels CUDA personalizados e permitindo uma inferência autônoma com cache $O(1)$ que funciona de forma idêntica em CPUs, GPUs NVIDIA e TPUs a partir de uma única fonte JAX.

Cosmo Santoni2026-03-11🤖 cs.AI

Learning Bayesian and Markov Networks with an Unreliable Oracle

Este artigo investiga a aprendizagem de estrutura de redes de Markov e Bayesianas na presença de um oráculo de independência condicional não confiável, demonstrando que redes de Markov podem ser identificadas mesmo com erros moderadamente exponenciais sob certas condições de conectividade, enquanto redes Bayesianas não toleram erros para identificação garantida, e apresentando algoritmos para casos onde a estrutura é unicamente identificável.

Juha Harviainen, Pekka Parviainen, Vidya Sagar Sharma2026-03-11🤖 cs.LG

a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors

Este artigo apresenta o algoritmo a-TMFG, uma abordagem escalável que supera as limitações de memória e tempo do TMFG tradicional ao utilizar grafos de k-vizinhos mais próximos e gerenciamento de memória para construir representações gráficas eficientes em conjuntos de dados com milhões de observações.

Lionel Yelibi2026-03-11🤖 cs.LG

An Optimal Control Approach To Transformer Training

Este artigo propõe uma abordagem de controle ótimo rigorosa para o treinamento de Transformers, modelando a arquitetura como um sistema de partículas controlado com dinâmica de McKean-Vlasov e utilizando um processo de decisão de Markov levantado em medidas de probabilidade para estabelecer políticas globalmente ótimas e robustas, oferecendo uma alternativa viável aos métodos baseados em gradiente que não exigem suavidade ou convexidade.

Ka\u{g}an Akman, Naci Saldı, Serdar Yüksel2026-03-11🤖 cs.LG

SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation

O artigo apresenta o SCDP, uma abordagem que utiliza um modelo de difusão condicionado a sensores e treinamento com observações mistas para aprender locomoção em humanoides apenas com dados onboard, alcançando desempenho comparável a métodos que usam estados privilegiados e demonstrando sucesso em robôs reais sem necessidade de estimativa de estado externa.

Milo Carroll, Tianhu Peng, Lingfan Bao, Chengxu Zhou, Zhibin Li2026-03-11🤖 cs.LG

Routing without Forgetting

O artigo apresenta o "Routing without Forgetting" (RwF), uma arquitetura de transformador que utiliza camadas de recuperação associativa baseada em energia para realizar o aprendizado contínuo online sem esquecer, gerando prompts dinâmicos via recuperação associativa de um único passo em vez de depender de otimização iterativa baseada em gradiente.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

Towards Understanding Adam Convergence on Highly Degenerate Polynomials

Este trabalho demonstra que o algoritmo Adam possui propriedades de autoconvergência inerentes em polinômios altamente degenerados, alcançando convergência linear local sem agendadores externos graças a um mecanismo de desacoplamento que amplifica exponencialmente a taxa de aprendizado, superando significativamente métodos como o Gradiente Descendente e Momentum.

Zhiwei Bai, Jiajie Zhao, Zhangchen Zhou, Zhi-Qin John Xu, Yaoyu Zhang2026-03-11🤖 cs.LG

Nonparametric Variational Differential Privacy via Embedding Parameter Clipping

Este trabalho introduz uma estratégia de recorte de parâmetros fundamentada teoricamente para o Nonparametric Variational Differential Privacy (NVDP), que melhora a estabilidade numérica e otimiza o equilíbrio entre privacidade e utilidade ao restringir os parâmetros do modelo para minimizar o limite superior da Divergência de Rényi.

Dina El Zein, Shashi Kumar, James Henderson2026-03-11🤖 cs.LG

Memorization capacity of deep ReLU neural networks characterized by width and depth

Este artigo caracteriza a capacidade de memorização de redes neurais profundas com ativação ReLU, estabelecendo que o produto dos quadrados da largura e da profundidade ( $W^2L^2$ ) deve ser da ordem de $\mathcal{O}(N\log(\delta^{-1}))$ para memorizar $N$ pontos de dados, demonstrando que essa construção é ótima até fatores logarítmicos e definindo explicitamente o trade-off entre largura e profundidade nesse regime.

Xin Yang, Yunfei Yang2026-03-11🤖 cs.LG

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

Este artigo apresenta um quadro unificado para a fatoração de matrizes não negativas (NMF) tradicional e convexa, utilizando funções de custo baseadas nas distribuições Tweedie e Binomial Negativa, derivando regras de atualização multiplicativa via algoritmos MM e validando empiricamente a superioridade desses modelos em dados com sobredispersão.

Elisabeth Sommer James, Asger Hobolth, Marta Pelizzola2026-03-11🤖 cs.LG

Learning the Hierarchical Organization in Brain Network for Brain Disorder Diagnosis

O artigo apresenta o BrainHO, um novo método que aprende a organização hierárquica intrínseca de redes cerebrais a partir de dados de fMRI, superando as limitações das abordagens baseadas em sub-redes pré-definidas para alcançar diagnóstico superior de transtornos neurológicos e identificar biomarcadores clinicamente relevantes.

Jingfeng Tang, Peng Cao, Guangqi Wen, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-11🤖 cs.LG

Multi-DNN Inference of Sparse Models on Edge SoCs

O artigo apresenta o SparseLoom, um sistema demonstrador que utiliza a técnica de "model stitching" para recombinação de subgrafos de modelos esparsos sem retreinamento, permitindo a execução eficiente de múltiplas DNNs em SoCs de borda e reduzindo significativamente as violações de objetivos de nível de serviço (SLO), aumentando o throughput e diminuindo a sobrecarga de memória em comparação com sistemas existentes.

Jiawei Luo, Di Wu, Simon Dobson, Blesson Varghese2026-03-11🤖 cs.LG

Evolution of Photonic Quantum Machine Learning under Noise

Este artigo de revisão analisa sistematicamente as fontes de ruído em sistemas de Aprendizado de Máquina Quântica Fotônica (PQML), examinando suas arquiteturas e algoritmos, categorizando os mecanismos de ruído e seus impactos no desempenho, além de revisar técnicas de caracterização e estratégias de mitigação para o desenvolvimento de sistemas robustos e escaláveis.

A. M. A. S. D. Alagiyawanna, Asoka Karunananda2026-03-11⚛️ quant-ph

Well Log-Guided Synthesis of Subsurface Images from Sparse Petrography Data Using cGANs

Este artigo apresenta um framework baseado em Redes Adversariais Generativas Condicionais (cGANs) que utiliza dados de perfis de poço para sintetizar imagens contínuas de seções delgadas de rochas carbonáticas, preenchendo lacunas na caracterização de reservatórios e apoiando aplicações de transição energética.

Ali Sadeghkhani, A. Assadi, B. Bennett, A. Rabbani2026-03-11🤖 cs.LG

FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting

O artigo apresenta o FreqCycle, um novo framework de previsão de séries temporais que integra módulos de aprendizado no domínio do tempo e da frequência para capturar padrões de baixa, média e alta frequência, além de sua extensão hierárquica MFreqCycle para lidar com periodicidades acopladas, alcançando desempenho superior e maior eficiência em comparação com métodos existentes.

Boya Zhang, Shuaijie Yin, Huiwen Zhu, Xing He2026-03-11🤖 cs.LG

No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

Este trabalho analisa empiricamente como o viés de rótulo e os subtipos de viés de seleção impactam a avaliação, o desempenho e a eficácia das mitigações em modelos de classificação, introduzindo um novo framework que revela a ausência de trade-off entre justiça e precisão quando os modelos são avaliados em dados não enviesados e destaca a dependência dos métodos de mitigação em relação ao tipo específico de viés presente.

Magali Legast, Toon Calders, François Fouss2026-03-11🤖 cs.LG

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Este trabalho apresenta um framework de código aberto para detecção de anomalias em séries temporais usando Redes Neurais em Grafos (GNNs), que não só demonstra melhor desempenho e interpretabilidade em comparação com modelos de base, mas também oferece uma avaliação crítica das práticas atuais de métricas e thresholding no campo.

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

← Anterior Próximo →

cs.LG