cs.LG artigos | Gist.Science

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

O artigo propõe o RAD, um novo framework de alinhamento em Aprendizado por Reforço com Feedback Humano (RLHF) que substitui restrições de custo esperado por restrições de Dominância Estocástica de Primeira Ordem dentro de um quadro de Transporte Ótimo, permitindo o controle universal de riscos espectrais e oferecendo maior robustez contra falhas catastróficas e distribuições fora do padrão.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artigo apresenta um framework de previsão seletiva para a recuperação de estruturas moleculares a partir de espectros de massa, demonstrando que medidas de incerteza de baixo custo computacional e a aplicação de limites de risco sem distribuição permitem que os modelos abstenham-se de previsões inseguras, garantindo assim uma taxa de erro controlada em aplicações de alto risco.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

O artigo apresenta o Scorio, uma biblioteca de código aberto que formaliza e implementa diversos métodos estatísticos para classificar modelos de linguagem de raciocínio sob escalabilidade em tempo de teste, demonstrando que a maioria das abordagens concorda fortemente com um padrão-ouro bayesiano tanto em cenários de múltiplas tentativas quanto de tentativa única.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Este artigo apresenta uma nova abordagem de aprendizado auto-supervisionado para sinais de IMU no pulso que, ao tokenizar o movimento com base na teoria dos submovimentos e pré-treinar um Transformer para reconstrução de segmentos, supera os métodos existentes em reconhecimento de atividades humanas e demonstra maior eficiência em cenários com poucos dados.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

O artigo apresenta o Pointy, uma arquitetura leve baseada em transformers que, apesar de ser treinada apenas em 39 mil nuvens de pontos, supera modelos fundacionais maiores e complexos, demonstrando a eficácia de um design cuidadoso e de uma avaliação padronizada no domínio de nuvens de pontos.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

O artigo apresenta o TOSSS, um novo benchmark baseado no banco de dados CVE que avalia a capacidade de Grandes Modelos de Linguagem (LLMs) de distinguir entre trechos de código seguros e vulneráveis, atribuindo uma pontuação de segurança que varia de 0 a 1.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Este artigo apresenta o framework FRIEND, que utiliza Aprendizado Federado para otimizar conjuntamente a configuração de múltiplas Superfícies Inteligentes Reconfiguráveis (RIS) e a detecção de eavesdroppers em redes B5G, resultando em um aumento de aproximadamente 30% na taxa de sigilo e garantindo privacidade e eficiência computacional para comunicações IIoT.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Este artigo investiga o uso de Aprendizado Federado para seleção de feixes em constelações de satélites LEO, demonstrando que um modelo de Rede Neural de Grafos supera um Perceptron Multicamadas em precisão e estabilidade, especialmente em baixos ângulos de elevação, permitindo uma gestão de feixes leve e inteligente para futuras redes NTNs.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

O artigo demonstra que as camadas MLP em modelos de linguagem transformadores realizam um roteamento binário de sinais contínuos, onde neurônios específicos atuam como um mecanismo de comutação que decide quais tokens necessitam de processamento não linear, explicando assim por que aproximações polinomiais suaves falham em capturar a dinâmica dessas redes.

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

Este artigo propõe uma abordagem que desacopla a quantificação de incertezas da arquitetura da rede neural, integrando a distribuição de parâmetros do modelo como entrada via amostragem MCMC para criar emuladores eficientes e agnósticos que replicam a precisão estatística dos modelos físicos com custo computacional drasticamente reduzido.

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

O artigo "ForwardFlow" propõe um método de inferência estatística baseado em simulação que utiliza uma rede neural profunda única para resolver o problema inverso de estimação de parâmetros, demonstrando propriedades desejáveis como exatidão em amostras finitas, robustez a contaminação de dados e capacidade de aproximar automaticamente algoritmos complexos como o EM.

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artigo apresenta uma abordagem unificada de Otimização Bayesiana baseada em Processos Gaussianos, que acelera a busca por pontos estacionários em superfícies de energia potencial através de um ciclo de seis etapas adaptável, técnicas avançadas de amostragem e regularização, e uma implementação prática em Rust que demonstra a eficiência e a escalabilidade do método.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

O artigo propõe uma abordagem de aprendizado de máquina baseada em campos neurais fatorizados para a decomposição espectral do operador de Koopman, permitindo a previsão precisa e estável de dinâmicas físicas paramétricas complexas em horizontes temporais longos, com generalização para parâmetros não vistos e análise espectral, sem depender de equações governantes explícitas.

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Este estudo valida a reprodutibilidade do mapeamento de eletrofisiologia para transcriptômica em interneurônios GABAérgicos do córtex, demonstrando que modelos de sequência baseados em atenção podem igualar baselines tradicionais e que o aprendizado por transferência de dados de camundongos para humanos melhora a previsão de subclasses celulares.

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

Este artigo apresenta a Quantização Vetorial de Rede de Leech (LLVQ), um algoritmo prático e altamente eficiente que utiliza a estrutura matemática ótima da rede de Leech em 24 dimensões para comprimir modelos de linguagem grandes (LLMs), superando os métodos atuais ao eliminar a necessidade de armazenamento explícito de códigos e oferecer desempenho de quantização de ponta.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

O artigo apresenta o V2M-Zero, um método inovador de geração de música sincronizada com vídeos que, ao alinhar as curvas de eventos temporais de cada modalidade de forma independente, alcança resultados superiores aos modelos baseados em dados pareados sem exigir treinamento cruzado ou pares de dados.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

O artigo apresenta o NeFTY, um framework de física diferenciável que utiliza campos neurais para realizar a reconstrução quantitativa 3D de propriedades materiais e a localização de defeitos subsuperficiais a partir de medições térmicas, superando as limitações de métodos tradicionais e redes PINNs em cenários de difusão transitória.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

O artigo propõe o XConv, uma camada de convolução de substituição direta que reduz significativamente o uso de memória durante o treinamento de redes neurais convolucionais ao armazenar ativações comprimidas e aproximar gradientes via estimativa de traço aleatória, mantendo a compatibilidade com arquiteturas existentes e garantindo desempenho comparável aos métodos de gradiente exato.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

Este artigo apresenta uma revisão sistemática do Aprendizado Federado Descentralizado (DFL) de 2018 a 2026, organizando os métodos em famílias arquitetônicas, propondo uma taxonomia baseada em desafios, analisando práticas de avaliação e delineando direções futuras para pesquisas em segurança, privacidade e incentivos em ambientes descentralizados.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Este artigo supera as limitações matemáticas anteriores ao provar, utilizando avanços no problema da soma de subconjuntos multidimensional, que redes neurais convolucionais superparametrizadas contêm sub-redes estruturadas que podem aproximar redes menores sem treinamento, estabelecendo assim o primeiro limite sub-exponencial para o Hipótese da Bilhete de Loteria Forte no contexto de poda estruturada.

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG

← Anterior Próximo →