cs.LG artigos | Gist.Science

Regularized Online RLHF with Generalized Bilinear Preferences

Este artigo propõe um método de RLHF online regularizado com preferências generalizadas bilineares que, ao utilizar matrizes de baixo posto e antissimétricas, garante limites de arrependimento estatisticamente eficientes e livres de exponenciais em dimensões altas, superando as restrições de trabalhos anteriores limitados à regularização por KL reverso.

Junghyun Lee, Minju Hong, Kwang-Sung Jun + 2 more2026-03-06💻 cs

Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory

Este trabalho apresenta o Lap2, uma nova abordagem que supera as limitações de dimensionalidade do mecanismo Laplace no DP-SGD ao permitir o uso de clipping L2 através da teoria de majorização, resultando em desempenho superior ao do mecanismo Gaussiano em modelos de alta dimensão sob fortes restrições de privacidade.

Meisam Mohammady, Qin Yang, Nicholas Stout, Ayesha Samreen, Han Wang, Christopher J Quinn, Yuan Hong2026-03-06🔒 cs.CR

Inference-time optimization for experiment-grounded protein ensemble generation

Os autores propõem um novo quadro de otimização no tempo de inferência que, ao otimizar representações latentes e combinar priors estruturais com dados experimentais, gera ensembles de proteínas mais diversificados, fisicamente plausíveis e em melhor acordo com dados experimentais do que os métodos atuais, ao mesmo tempo que expõe vulnerabilidades nas métricas de confiança de modelos como o AlphaFold3.

Advaith Maddipatla, Anar Rzayev, Marco Pegoraro + 5 more2026-03-06💻 cs

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

O artigo apresenta o JAILBREAK FOUNDRY (JBF), um sistema baseado em agentes múltiplos que traduz automaticamente artigos sobre jailbreaks em módulos executáveis padronizados, permitindo a reprodutibilidade precisa e a avaliação unificada de ataques em modelos de linguagem.

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer

O artigo apresenta o DiffusionHarmonizer, um framework de aprimoramento generativo online que utiliza um aprimorador condicionado temporalmente derivado de modelos de difusão para transformar renderizações de reconstruções neurais imperfeitas em saídas fotorealistas e temporalmente consistentes, corrigindo artefatos e harmonizando a iluminação para simulações robóticas escaláveis.

Yuxuan Zhang, Katarína Tóthová, Zian Wang + 7 more2026-03-06💻 cs

Fine-grained Soundscape Control for Augmented Hearing

O artigo apresenta o Aurchestra, o primeiro sistema capaz de oferecer controle sonoro granular e em tempo real em dispositivos auditivos com recursos limitados, permitindo que os usuários ajustem independentemente os volumes de até cinco fontes sonoras simultâneas por meio de uma interface dinâmica e uma rede de extração multi-saída otimizada.

Seunghyun Oh, Malek Itani, Aseem Gauri + 1 more2026-03-06💻 cs

Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics

O estudo demonstra que a persistência do estado do interpretador é uma semântica fundamental que molda a eficiência e a estabilidade dos agentes de IA, revelando que o desalinhamento entre os dados de treinamento e o ambiente de execução causa erros críticos ou desperdício de recursos, mesmo sem afetar a qualidade final da solução.

Victor May, Aaditya Salgarkar, Yishan Wang + 2 more2026-03-06💻 cs

Learn Hard Problems During RL with Reference Guided Fine-tuning

O artigo apresenta o ReGFT, um método que utiliza soluções de referência humanas para sintetizar trajetórias de raciocínio viáveis em problemas difíceis, superando a esparsidade de recompensas e acelerando o treinamento por reforço (RL) para raciocínio matemático em modelos de linguagem.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling

O artigo apresenta o VoxKnesset, um novo conjunto de dados aberto e longitudinal com cerca de 2.300 horas de discurso parlamentar em hebraico (2009-2025) de 393 falantes, destinado a avaliar e melhorar a modelagem de sistemas de processamento de fala para o envelhecimento vocal.

Yanir Marmor, Arad Zulti, David Krongauz + 4 more2026-03-06💻 cs

MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interatomic Potentials

O artigo apresenta o MatRIS, um potencial interatômico de aprendizado de máquina invariante e eficiente que utiliza um mecanismo de atenção separável para modelar interações de três corpos, alcançando precisão comparável aos modelos equivariantes mais avançados com custos computacionais significativamente menores.

Yuanchang Zhou, Siyu Hu, Xiangyu Zhang + 3 more2026-03-06💻 cs

Conformal Graph Prediction with Z-Gromov Wasserstein Distances

Este artigo propõe um framework de previsão conformal para outputs estruturados em forma de grafos, que utiliza a distância Z-Gromov-Wasserstein (FGW) e a regressão quantílica conformalizada de pontuação (SCQR) para fornecer garantias de cobertura livres de distribuição e conjuntos de previsão adaptativos em tarefas como a identificação de moléculas.

Gabriel Melo, Thibaut de Saivre, Anna Calissano + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

O artigo apresenta o IoUCert, um novo framework de verificação formal que supera as limitações existentes ao garantir a robustez de detectores de objetos baseados em âncoras, como SSD e YOLO, através de uma transformação de coordenadas que permite o cálculo de limites ótimos para a métrica de Interseção sobre União (IoU) sem degradação de precisão.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

Incremental Graph Construction Enables Robust Spectral Clustering of Texts

O artigo propõe uma construção incremental de grafos k-NN que garante a conectividade do grafo por design, superando a fragilidade dos métodos padrão em regimes de baixa esparsidade e melhorando a robustez do agrupamento espectral de embeddings de texto.

Marko Pranjić, Boshko Koloski, Nada Lavrač + 2 more2026-03-06💻 cs

Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning

Este artigo propõe o uso de um autoencoder variacional condicional (CVAE) para realizar a reconstrução inversa de séries temporais de choque a partir de espectros de resposta ao choque, superando as limitações computacionais e de generalização dos métodos iterativos tradicionais ao oferecer uma abordagem baseada em dados, mais rápida e precisa.

Adam Watts, Andrew Jeon, Destry Newton + 1 more2026-03-06💻 cs

AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis

O artigo apresenta o AOI, um framework multiagente treinável que supera os desafios de privacidade e segurança na automação de SRE ao transformar trajetórias de falhas em sinais de aprendizado supervisionado, alcançando desempenho superior ao estado da arte em diagnósticos de nuvem autônomos.

Pei Yang, Wanyi Chen, Asuka Yuxi Zheng + 11 more2026-03-06💻 cs

RADAR: Learning to Route with Asymmetry-aware DistAnce Representations

O artigo apresenta o RADAR, um framework neural escalável que utiliza decomposição em valores singulares (SVD) e normalização Sinkhorn para permitir que solucionadores de problemas de roteamento de veículos lidem eficazmente com distâncias assimétricas, superando os métodos existentes em generalização e desempenho.

Hang Yi, Ziwei Huang, Yining Ma + 1 more2026-03-06💻 cs

stratum: A System Infrastructure for Massive Agent-Centric ML Workloads

O artigo apresenta o Stratum, uma infraestrutura de sistema unificada que desacopla a execução de pipelines do planejamento em buscas de pipelines agênicas, integrando-se ao ecossistema Python para compilar e executar lotes de pipelines em backends heterogêneos, alcançando acelerações de até 16,6x.

Arnab Phani, Elias Strauss, Sebastian Schelter2026-03-06💻 cs

Why Are Linear RNNs More Parallelizable?

Este artigo estabelece uma conexão teórica fundamental entre complexidade computacional e arquiteturas de redes neurais, demonstrando que as RNNs lineares são altamente paralelizáveis por pertencerem à classe $\mathsf{NC}^1$ (semelhante aos Transformers), enquanto as RNNs não lineares enfrentam barreiras de paralelização ao resolverem problemas completos em $\mathsf{L}$ ou $\mathsf{P}$ .

William Merrill, Hongjian Jiang, Yanhong Li + 2 more2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

O artigo propõe um framework de tradução não pareada de MRI de ultra-baixo campo para alto campo, baseado em uma Ponte Neural de Schrödinger aprimorada com distribuição guiada por difusão e regularização de preservação anatômica, que melhora o realismo e a fidelidade estrutural das imagens cerebrais.

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs

LoRA-MME: Multi-Model Ensemble of LoRA-Tuned Encoders for Code Comment Classification

O artigo apresenta o LoRA-MME, uma solução de ensemble multi-modelo que combina quatro codificadores transformadores ajustados com LoRA para classificação de comentários de código, alcançando alta precisão semântica mas enfrentando penalidades de pontuação devido ao alto custo computacional na competição NLBSE'26.

Md Akib Haider, Ahsan Bulbul, Nafis Fuad Shahid + 2 more2026-03-06💻 cs

← Anterior Próximo →