cs.LG artigos | Gist.Science

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Este artigo apresenta o MSKernelBench, um benchmark abrangente para múltiplos cenários de kernels CUDA, e o CUDAMaster, um sistema multiagente orientado por hardware que supera métodos existentes e rivaliza com bibliotecas proprietárias na otimização automática de kernels para diversas aplicações científicas e de aprendizado de máquina.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

Este artigo propõe o método SPCP, que melhora a detecção de dados fora de distribuição ao modificar o treinamento de classificadores para depender de padrões de contribuição de parâmetros mais densos e orientados a fronteiras, mitigando assim a superconfiança causada pela dependência excessiva de poucos parâmetros dominantes.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Este artigo apresenta um modelo substituto baseado em uma rede neural de grafos espaço-temporal dual que, ao acoplar dinâmicas em nível de nós e elementos, prevê com eficiência e baixo custo computacional as respostas não lineares de vigas de concreto armado sob flexão, superando as limitações de perda de picos em representações baseadas apenas em nós.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

O artigo propõe o wDPO, uma abordagem robusta de alinhamento de LLMs que utiliza uma estratégia hierárquica de winsorização para identificar e tratar distintos tipos de ruído em dados de preferência, melhorando significativamente a qualidade e a robustez do alinhamento em comparação com métodos existentes.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Este estudo apresenta um sistema automatizado de segmentação e classificação de sons intestinais, utilizando sensores acústicos vestíveis e modelos de aprendizado profundo, que oferece uma avaliação objetiva e quantitativa da atividade gastrointestinal, reduzindo significativamente o tempo de anotação manual e apoiando o diagnóstico clínico.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

Este artigo demonstra que a aprendibilidade baseada em margens em espaços métricos arbitrários depende fundamentalmente da desigualdade triangular quando as margens são suficientemente grandes, estabelecendo um limiar universal para a aprendibilidade e provando que tal fenômeno não pode ser sempre reduzido a classificações lineares em espaços de Banach, onde a complexidade de amostragem escala polinomialmente com o inverso da margem.

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Este artigo apresenta o estudo ODA-Fin, que demonstra que a qualidade e o perfil de dificuldade dos dados de pós-treinamento são determinantes para o desempenho de LLMs em finanças, resultando em modelos e conjuntos de dados superiores aos atuais de código aberto.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

O artigo apresenta o LightMedSeg, uma arquitetura de segmentação médica 3D leve e eficiente que, ao integrar priores anatômicos e mecanismos de roteamento adaptativo, alcança alta precisão com apenas 0,48M de parâmetros, superando as limitações de modelos baseados em Transformer em cenários com restrições de memória e dados.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Este artigo propõe e valida um método aprimorado de regressão de postos condicionais (CRRR) utilizando modelos de transformação condicional profunda (DCTM) para estimar a mobilidade intergeracional com maior precisão em cenários não lineares e com resultados discretos, aplicando-o com sucesso a estudos sobre persistência de renda nos EUA e mobilidade educacional na Índia.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

O artigo apresenta o PT-RAG, um novo framework de Geração Aumentada por Recuperação (RAG) que utiliza recuperação diferenciada e consciente do tipo celular para superar as limitações de generalização dos métodos atuais na previsão de respostas celulares a perturbações genéticas.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

O artigo apresenta o WeDas, um novo framework que melhora a precisão dos agentes de pesquisa profunda ao alinhar suas consultas com a estrutura de distribuição de conteúdo da web, utilizando um mecanismo de sondagem para estimar a compatibilidade entre a intenção do agente e os resultados de busca.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Este estudo apresenta o framework LF2L, uma abordagem de aprendizado federado horizontal que integra dados locais de sobreviventes de câncer de pulmão com dados externos do programa SEER dos EUA através de uma fusão de perdas, superando desafios de privacidade e inconsistência de características para melhorar significativamente a previsão de cânceres secundários primários.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Este artigo propõe e avalia dois métodos de aprendizado simbólico, o SyNF e o SyTF, que geram equações algébricas interpretáveis para prever séries temporais caóticas com precisão competitiva e transparência científica, superando as limitações de "caixa preta" dos modelos de deep learning.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Este artigo propõe uma estrutura adaptativa de agendamento duplo para clínicas ambulatoriais que integra previsão individualizada de faltas com aprendizado por reforço multi-objetivo, otimizando dinamicamente as decisões de agendamento para mitigar o impacto das faltas de pacientes enquanto equilibra congestionamento e tempos de espera.

Ninda Nurseha Amalina, Heungjo An2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

O artigo apresenta as Variational Flow Maps (VFMs), um novo framework que permite a geração condicional de imagens de alta qualidade em um único passo ao aprender uma distribuição de ruído adaptada via um modelo de adaptador, superando as limitações de trajetórias iterativas dos modelos de difusão tradicionais para resolver problemas inversos e condicionais com maior eficiência.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

Fast and Flexible Audio Bandwidth Extension via Vocos

Este artigo apresenta um modelo de extensão de largura de banda baseado no Vocos que gera conteúdo de alta frequência ausente em áudio de 8 a 48 kHz com qualidade competitiva e eficiência extrema, alcançando taxas de processamento em tempo real de 0,0001 em GPU e 0,0053 em CPU.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Este artigo propõe uma nova abordagem para a descoberta de simetrias contínuas que, em vez de otimizar geradores de transformação, identifica padrões de esparsidade estruturada no domínio espectral obtido por meio da Transformada de Fourier Generalizada, demonstrando sua eficácia em tarefas como o pêndulo duplo e a classificação de quarks top.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

O artigo apresenta o AutoResearch-RL, um framework de aprendizado por reforço que permite a agentes autônomos descobrirem e aprimorarem continuamente arquiteturas de redes neurais e hiperparâmetros sem supervisão humana, alcançando desempenho superior ou equivalente ao de configurações ajustadas manualmente em um único GPU após cerca de 300 iterações.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Este artigo propõe um novo framework de previsão de rendimento de culturas em nível de condado que combina um modelo de base multi-escala para capturar dinâmicas temporais de curto e longo prazo com uma estratégia de adaptação baseada em recuperação para melhorar a generalização espacial, superando assim as limitações de métodos existentes em grandes regiões.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

O artigo apresenta o StructSAM, um framework de fusão e recuperação de tokens que preserva a estrutura e o espectro para otimizar os modelos Segment Anything (SAM), reduzindo significativamente o custo computacional sem comprometer a precisão nas bordas e nas regiões de prompt.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

← Anterior Próximo →