cs.LG artigos | Gist.Science

How Far Can Unsupervised RLVR Scale LLM Training?

Este artigo analisa o Aprendizado por Reforço Não Supervisionado com Recompensas Verificáveis (URLVR), demonstrando que os métodos intrínsecos enfrentam limites de escala devido ao alinhamento entre confiança e correção, enquanto propõe métricas para identificar esses limites e explora recompensas externas como uma alternativa promissora para superar essas barreiras.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

Este artigo caracteriza e aprimora uma arquitetura híbrida de rede neural quântica em grafos para a reconstrução de trajetórias de partículas carregadas em experimentos de alta luminosidade do LHC, demonstrando melhorias no comportamento de treinamento e na convergência do modelo.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

O artigo propõe o Momentum SVGD-EM, um método acelerado que incorpora a aceleração de Nesterov tanto nas atualizações de parâmetros quanto no espaço de medidas de probabilidade para otimizar a estimativa de máxima verossimilhança marginal (MMLE) e acelerar a convergência em diversos cenários de baixa e alta dimensionalidade.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Este trabalho utiliza o framework de busca evolutiva guiada por IA, AlphaEvolve, para identificar uma nova instância de pior caso que eleva o limite inferior da razão entre o ganho de trade ótimo e o do mecanismo do Ofertador Aleatório para 2,0749, superando as estimativas anteriores.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

O artigo apresenta os Modelos de Gargalo Causal Estrutural (SCBMs), uma nova classe de modelos causais que assume que os efeitos entre variáveis de alta dimensão dependem apenas de estatísticas resumidas de baixa dimensão, oferecendo uma estrutura flexível para redução de dimensionalidade específica de tarefas e estimável com algoritmos simples, com benefícios demonstrados na transferência de aprendizado com poucos dados.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

O artigo apresenta o Trilobyte, um esquema de tokenização em nível de byte que viabiliza a compressão sem perdas de áudio em alta fidelidade (até 24 bits) usando modelos de linguagem autoregressivos, superando o FLAC em resoluções de 8 e 16 bits, embora os ganhos de compressão diminuam à medida que a profundidade de bits aumenta.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Este trabalho propõe o primeiro algoritmo heurístico consciente de precisão para otimizar conjuntamente as camadas de particionamento e atribuições de clientes em Arquiteturas de Aprendizado Federado Dividido Hierárquico (HSFL), demonstrando que tal abordagem pode melhorar a precisão do modelo em 3%, reduzir o atraso em 20% e diminuir a sobrecarga de comunicação em 50% em comparação com soluções existentes.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

O artigo propõe o Agentic Critical Training (ACT), uma abordagem de aprendizado por reforço que supera as limitações da aprendizagem por imitação ao treinar agentes para autonomamente julgar e refletir sobre a qualidade de suas ações, resultando em melhor desempenho e generalização em benchmarks desafiadores.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

O artigo apresenta o "Impermanent", um novo benchmark ao vivo que avalia modelos de previsão de séries temporais em ambientes dinâmicos e não estacionários, utilizando dados em tempo real da atividade no GitHub para superar as limitações das divisões estáticas tradicionais e medir a verdadeira generalização temporal.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

Este artigo propõe uma abordagem baseada em modelos de frequência mista para prever taxas de câmbio, demonstrando sua eficácia na superação das limitações causadas pela agregação temporal e na resolução do "puzzle" de Meese e Rogoff, com validação empírica no par CAD/USD.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

Este artigo propõe um framework interpretável baseado em conceitos médicos-chave e redes neurais de convolução gráfica (GCN) para classificar imagens de ultrassom fetal, oferecendo explicações alinhadas à cognição clínica que superam as limitações de transparência dos modelos de deep learning tradicionais.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

Este artigo apresenta um modelo baseado em redes neurais e LSTM que demonstra a forte correlação entre as tendências de casos de COVID-19 e Dengue, permitindo estimar infecções por Dengue em países com dados insuficientes utilizando informações da COVID-19.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

Este artigo apresenta um método escalável e robusto que utiliza Redes Neurais em Grafos (GNNs) aplicadas a grafos de fatores para realizar estimativa de estado linear rápida e precisa em sistemas de potência com PMUs, mantendo a precisão mesmo na presença de falhas de medição ou comunicação.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

O artigo apresenta o Ancestral GFlowNet (AGFN), um algoritmo de aprendizado por reforço que realiza inferência distribucional sobre grafos ancestrais e integra conhecimento prévio e feedback incerto de especialistas para refinar a descoberta causal, superando métodos existentes em precisão estrutural.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

Este artigo apresenta um quadro unificado para aprender objetos desconhecidos a partir de medições lineares arbitrárias usando classes de modelos não lineares, estabelecendo limites de generalização próximos ao ótimo que relacionam a quantidade de dados necessária à complexidade estrutural do modelo e à variação deste em relação ao processo de amostragem.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Este artigo deriva estimativas teóricas de limites inferiores para o consumo energético de otimizadores neuromórficos ideais que utilizam o paradigma de "aprendizado na memória" (LIM), estabelecendo métricas de eficiência energética independentes do modelo que dependem apenas do número de operações, tamanho do modelo, velocidade de convergência e precisão da solução.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Este artigo propõe um novo sistema de detecção de alucinações visuais estruturais em imagens de personagens de desenho animado geradas por modelos Texto-para-Imagem, utilizando um Modelo Visão-Linguagem aprimorado por aprendizado em contexto com orientação de pose (PA-ICVL), que demonstra melhorias significativas de desempenho em comparação com métodos baseados apenas em imagens RGB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

O artigo apresenta o BInD, um modelo de difusão baseado em conhecimento que gera simultaneamente moléculas e suas interações com proteínas-alvo, superando as limitações de métodos existentes ao equilibrar eficazmente múltiplos objetivos no desenho de fármacos estruturalmente baseado.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Este artigo apresenta um pipeline inovador de aprendizado ativo em duas etapas para reconhecimento automático de fala, que combina agrupamento de x-vectors e inferência bayesiana via dropout Monte Carlo para selecionar amostras diversificadas e informativas, otimizando significativamente o esforço de rotulagem e o desempenho do modelo.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Este trabalho oferece uma revisão abrangente e uma especificação formal detalhada das Redes de Codificação Preditiva (PCNs), situando-as no contexto dos métodos modernos de aprendizado de máquina e destacando seu potencial como uma estrutura versátil e biologicamente plausível para futuras inovações em IA.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

← Anterior Próximo →