cs.LG artigos | Gist.Science

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Este artigo propõe um método de treinamento que utiliza um prior de atenção sensível ao comprimento e um controlador de ganho adaptativo para melhorar a eficiência do raciocínio em modelos Transformer sem aumentar os custos computacionais durante a inferência.

Rian AtriWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Este trabalho estabelece novos limites de generalização transdutiva baseados em transporte ótimo e distâncias de Wasserstein para classificação de nós em grafos, demonstrando que são computacionalmente eficientes, correlacionam-se fortemente com o desempenho empírico e revelam como o processo de agregação de GNNs cria um compromisso entre concentração intraclasse e separação interclasse que explica a relação não monotônica entre profundidade e erro de generalização.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

O artigo apresenta o DendroNN, uma rede neural centrada em dendritos que utiliza um mecanismo de detecção de sequências de pulsos e uma fase de reconfiguração sem gradientes para classificar dados baseados em eventos com alta eficiência energética, superando hardware neuromórfico atual em até quatro vezes na mesma tarefa de classificação de áudio.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Este artigo preenche lacunas na análise do Thompson Sampling com Processos Gaussianos (GP-TS) ao estabelecer limites de arrependimento inferiores e superiores, incluindo limites de segundo momento, arrependimento "leniente" esperado e uma melhoria no limite cumulativo em relação ao horizonte temporal $T$ , superando as limitações anteriores que se restringiam principalmente a limites de arrependimento esperados.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

Proxy-Guided Measurement Calibration

Este artigo propõe um framework baseado em variáveis proxy e autoencoders variacionais para estimar e corrigir erros sistemáticos de medição em variáveis de resultado agregadas, como perdas de desastres, ao modelar e separar causalmente os componentes latentes de conteúdo e viés.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan LiuWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Este artigo estabelece um teorema de comparação gaussiana não assintótico que conecta a evolução de algoritmos de treinamento em modelos de mistura gaussiana a um sistema dinâmico substituto, permitindo provar rigorosamente expressões de campo médio dinâmico e introduzir um esquema de refinamento iterativo para cenários não assintóticos.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

O artigo apresenta o CLoE, um framework de aprendizado de consistência que utiliza objetivos de consistência global e regional entre especialistas para melhorar a segmentação de imagens médicas multimodais na presença de modalidades faltantes, garantindo robustez e precisão em estruturas críticas.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

O artigo apresenta o Reward-Zero, um mecanismo de recompensa implícita que utiliza embeddings de linguagem para transformar descrições de tarefas em sinais de progresso densos e semanticamente alinhados, acelerando o treinamento e melhorando a generalização em aprendizado por reforço sem a necessidade de engenharia de recompensas específica para cada tarefa.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu SheWed, 11 Ma🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

O artigo TA-GGAD propõe um modelo de grafos adaptativo que supera o problema de "Desassortatividade de Anomalias" para alcançar detecção generalista de anomalias em múltiplos domínios com uma única fase de treinamento, atingindo desempenho state-of-the-art em diversos grafos reais.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Este artigo apresenta um framework baseado em dados que combina um regressor de perceptron multicamadas e uma rede generativa adversarial condicional para prever a rugosidade superficial na manufatura aditiva por extrusão de material, integrando essas previsões a uma interface web interativa que visualiza a rugosidade em modelos 3D para auxiliar no planejamento de processos e orientação de peças.

Engin Deniz Erkan, Elif Surer, Ulas YamanWed, 11 Ma🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Este artigo propõe um framework de otimização de ordem zero com privacidade diferencial que estende a condensação de dados para modelos clínicos não diferenciáveis, permitindo a criação de conjuntos de dados sintéticos compactos que preservam a utilidade preditiva e garantem a segurança das informações dos pacientes para compartilhamento democrático.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

O artigo propõe o CAHC, um método de aprendizado contrastivo de ponta a ponta para agrupamento de hipergrafos atribuídos que integra simultaneamente a aprendizagem de representações e a atribuição de clusters, superando as abordagens tradicionais ao fornecer supervisão direta de agrupamento e alcançar desempenho superior em oito conjuntos de dados.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong LinWed, 11 Ma🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Este estudo propõe a VSOPINN, uma rede neural baseada em física aprimorada com otimização de sensores via diagramas de Voronoi, que permite a reconstrução precisa e robusta de campos de fluxo a partir de medições esparsas e a otimização integrada do posicionamento dos sensores.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang ZhuWed, 11 Ma🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

O artigo apresenta o SPAARS, um framework de aprendizado por reforço offline-to-online que utiliza uma exploração curricular segura no espaço latente para superar as limitações de desempenho dos métodos baseados em CVAE, transferindo o controle para o espaço de ações bruto e alcançando maior eficiência de amostragem e retornos superiores em tarefas de robótica.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

O artigo apresenta o FCDM, um modelo de difusão totalmente convolucional baseado no ConvNeXt que, ao utilizar apenas 50% dos FLOPs do DiT-XL/2, alcança desempenho competitivo com significativamente menos etapas de treinamento e maior eficiência, demonstrando que arquiteturas convolucionais modernas são uma alternativa viável e eficiente para a geração de imagens.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Este artigo propõe quatro melhorias ao algoritmo de correspondência espaço-temporal para rastreamento de trajetórias GPS em baixa frequência, demonstrando ganhos significativos em eficiência computacional e qualidade de trajetória através de validação em dados reais de Milão.

Ali Yousefian, Arianna Burzacchi, Simone VantiniWed, 11 Ma🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Este trabalho analisa sistematicamente como as escolhas de design do Processo de Decisão de Marko (MDP) afetam a transferência simulação-realidade no controle de processos industriais, demonstrando através de uma tarefa de mistura de cores que modelos de dinâmica baseados em física superam significativamente os modelos simplificados, alcançando até 50% de sucesso em hardware real sob restrições de precisão rigorosas.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder HeieckWed, 11 Ma🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Este artigo propõe uma abordagem de ponderação não paramétrica (NW) e sua extensão auxiliada por modelo (MNW) para avaliação de políticas fora de política em bandits contextuais, alcançando estimativas de valor com viés baixo e variância significativamente reduzida em comparação com métodos tradicionais como ponderação por probabilidade inversa e estimadores duplamente robustos.

Rong J. B. ZhuWed, 11 Ma🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Este trabalho apresenta o VMoER, uma abordagem bayesiana estruturada que confere quantificação de incerteza calibrada e escalável aos modelos de mistura de especialistas (MoE) ao aplicar inferência variacional apenas na etapa de roteamento, melhorando significativamente a estabilidade, a calibração e a detecção de dados fora da distribuição com um custo computacional marginal.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Este artigo apresenta os Fluxos Normalizadores Condicionados Temporalmente (tcNF), uma nova estrutura para detecção de anomalias em séries temporais multivariadas que modela com precisão as dependências temporais e a incerteza ao condicionar o fluxo a observações anteriores, demonstrando robustez e precisão superiores em comparação com métodos existentes.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

← Anterior Próximo →