cs.LG articles | Gist.Science

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Ce papier propose une méthode d'apprentissage exclusive intégrant des priors d'attention sensibles à la longueur et un contrôleur de gain adaptatif pour améliorer le raisonnement des Transformers sans augmenter les coûts d'inférence.

Rian AtriWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Cet article propose de nouvelles bornes de généralisation transductive pour la classification de nœuds dans les graphes, basées sur le transport optimal et les distances de Wasserstein, qui sont à la fois calculables et mieux corrélées aux performances empiriques que les mesures de complexité classiques, tout en expliquant le compromis entre concentration intra-classe et séparation inter-classe induit par l'agrégation des GNN.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Ce papier présente DendroNN, un réseau de neurones bio-inspiré qui exploite les mécanismes de détection de séquences des dendrites pour classifier efficacement des données événementielles via une phase de ré câblage sans gradient et une architecture matérielle asynchrone, surpassant ainsi les solutions neuromorphiques existantes en termes d'efficacité énergétique.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Ce papier établit de nouvelles bornes de regret pour l'optimisation bayésienne par échantillonnage de Thompson (GP-TS), comblant le fossé avec les analyses de GP-UCB en fournissant une borne inférieure, une borne supérieure sur le second moment du regret, des bornes de regret « lenient » et une amélioration de la borne cumulative sur l'horizon temporel.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

Proxy-Guided Measurement Calibration

Cet article propose un cadre guidé par des variables proxy et utilisant des autoencodeurs variationnels pour identifier et corriger les erreurs de mesure systématiques dans les variables de résultat agrégées, en modélisant la séparation entre les facteurs de contenu et les biais latents.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan LiuWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Cet article établit un théorème de comparaison gaussien reliant la dynamique d'entraînement d'algorithmes d'apprentissage automatique sur des mélanges gaussiens à un système dynamique simplifié, permettant de prouver rigoureusement les résultats asymptotiques de la théorie du champ moyen dynamique et de proposer des expressions plus précises pour les régimes non asymptotiques.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

L'article présente CLoE, un cadre d'apprentissage par consistance des experts qui améliore la segmentation des images médicales multimodales en cas de modalités manquantes en assurant l'accord entre les experts aux niveaux global et régional, tout en recalibrant dynamiquement les caractéristiques selon leur fiabilité.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Le papier présente Reward-Zero, un mécanisme de récompense implicite universel qui transforme les descriptions de tâches en langage naturel en signaux de progression denses pour accélérer et stabiliser l'apprentissage par renforcement sans nécessiter d'ingénierie spécifique.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu SheWed, 11 Ma🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Ce papier propose TA-GGAD, un modèle graphique fondamental adaptatif qui résout le problème de décalage de domaine dans la détection d'anomalies en modélisant la « désassortativité des anomalies » pour atteindre un état de l'art généralisable sur divers graphes réels avec un seul entraînement.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Cet article présente un cadre de données intégrant un réseau de neurones et un GAN conditionnel pour prédire la rugosité de surface dans la fabrication additive, couplé à une interface web interactive permettant de visualiser ces prédictions sur des modèles 3D afin d'optimiser l'orientation et les paramètres d'impression.

Engin Deniz Erkan, Elif Surer, Ulas YamanWed, 11 Ma🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Cet article propose un cadre d'optimisation d'ordre zéro et privé différentiellement pour étendre la condensation de données aux modèles cliniques non différentiables, permettant ainsi le partage sécurisé de données synthétiques préservant l'utilité des modèles de prédiction médicale.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Le papier propose CAHC, une méthode d'apprentissage par contraste en bout en bout pour le clustering d'hypergraphes attribués qui intègre simultanément l'apprentissage des représentations et l'affectation des clusters pour éviter l'inclusion d'informations non pertinentes et surpasser les méthodes existantes.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong LinWed, 11 Ma🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Cette étude propose VSOPINN, une architecture de réseaux de neurones informés par la physique enrichie par des diagrammes de Voronoi, qui optimise de bout en bout le placement des capteurs pour reconstruire avec précision et robustesse des écoulements fluides complexes à partir de mesures éparses.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang ZhuWed, 11 Ma🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

Le papier présente SPAARS, un cadre d'apprentissage par renforcement offline-to-online qui améliore la sécurité et l'efficacité de l'échantillonnage en initiant l'exploration dans un espace latent restreint avant de basculer vers l'espace d'action brut, surmontant ainsi les limitations de reconstruction des méthodes précédentes et surpassant les performances des modèles de base sur plusieurs tâches robotiques.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Cet article présente le modèle de diffusion entièrement convolutif (FCDM), une architecture inspirée de ConvNeXt qui offre une alternative hautement efficace et compétitive aux modèles basés sur les Transformers, permettant un entraînement performant avec moins de ressources computationnelles et de matériel.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Cet article propose quatre améliorations de l'algorithme de matching spatio-temporel pour les trajectoires GPS à faible fréquence, notamment via un tampon dynamique et une analyse comportementale, démontrant des gains significatifs en efficacité et en qualité de reconstruction des trajets sur des données réelles de Milan.

Ali Yousefian, Arianna Burzacchi, Simone VantiniWed, 11 Ma🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Cette étude démontre que le choix de la conception du processus de décision markovien, en particulier l'utilisation de modèles de dynamique fondés sur la physique, est déterminant pour réduire l'écart simulation-réalité et atteindre un taux de réussite de 50 % dans des tâches de contrôle industriel comme le mélange de couleurs.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder HeieckWed, 11 Ma🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Cet article propose une nouvelle méthode d'évaluation hors politique pour les bandits contextuels, appelée pondération non paramétrique (NW) et son extension assistée par modèle (MNW), qui surpasse les approches existantes en réduisant significativement la variance tout en maintenant un faible biais.

Rong J. B. ZhuWed, 11 Ma🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Ce papier présente VMoER, une approche bayésienne structurée qui intègre l'inférence variationnelle dans le routage des modèles Mixture-of-Experts pour fournir une quantification fiable de l'incertitude à grande échelle avec un surcoût computationnel négligeable.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Cet article présente les flux de normalisation conditionnés temporellement (tcNF), un nouveau cadre d'apprentissage profond qui améliore la détection d'anomalies dans les séries temporelles multivariées en modélisant avec précision les dépendances temporelles et les incertitudes via une approche autorégressive.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

← Précédent Suivant →