cs.LG articles | Gist.Science

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Cet article propose un cadre unifié pour évaluer comment la personnalisation des modèles d'apprentissage automatique affecte simultanément la précision des prédictions et la clarté des explications, en démontrant que ces impacts peuvent diverger et en établissant des limites théoriques pour détecter ces effets dans des contextes réels.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina MiolaneWed, 11 Ma🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Cet article propose une méthodologie pratique basée sur la notion de « signature spatiale » d'un ensemble de données pour évaluer et garantir la robustesse des évaluations de données par semi-valeurs face aux variations du choix de l'utilité.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Cet article présente un cadre intégré de type Real2Sim2Real pour la manipulation d'objets linéaires déformables, qui utilise l'inférence sans vraisemblance pour estimer les paramètres physiques à partir de données visuelles et proprioceptives afin d'entraîner des politiques visuomotrices en simulation et de les déployer avec succès dans le monde réel sans ajustement supplémentaire.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Cet article propose une méthode de rééquilibrage de l'importance des caractéristiques (FIR) qui améliore la fiabilité des indices de validité de clustering dans des mélanges gaussiens bruyants en atténuant l'influence des caractéristiques non pertinentes, renforçant ainsi la corrélation avec la vérité terrain même en présence de données de haute dimension.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Le papier présente HyConEx, un classifieur basé sur des hyperréseaux conçu pour les données tabulaires, qui génère simultanément des prédictions et des explications locales sous forme d'exemples contrefactuels, comblant ainsi le vide laissé par l'absence de classifieurs interprétables produisant directement des échantillons contrefactuels.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

Experiments with Optimal Model Trees

Cet article propose des formulations de programmation linéaire en nombres entiers pour construire des arbres de modèles optimaux avec des machines à vecteurs de support linéaires dans les feuilles, démontrant que cette approche globale permet d'obtenir des arbres plus petits et aussi précis que les méthodes gloutonnes ou d'autres algorithmes d'apprentissage automatique sur un large éventail de jeux de données.

Sabino Francesco Roselli, Eibe FrankWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Cet article propose une critique conséquentialiste des méthodes d'évaluation binaire en machine learning, démontrant par une revue empirique et un nouveau cadre théorique que les règles de score appropriées comme le score Brier sont supérieures aux métriques à seuil fixe, tout en fournissant l'outil logiciel `briertools` et une variante tronquée pour faciliter leur adoption pratique.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Cet article présente CDGLT, un cadre novateur et économe en calcul pour l'identification des métaphores multimodales qui utilise un mécanisme de dérive conceptuelle et un ajustement de la normalisation par couches pour atteindre des performances de pointe sur le benchmark MET-Meme.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia LiWed, 11 Ma🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

L'article présente la SGPO, une méthode qui améliore l'optimisation par politique relative de groupe (GRPO) en intégrant un juge étape par étape pour exploiter les signaux d'apprentissage des groupes de réponses entièrement incorrects, comblant ainsi une lacune majeure de l'apprentissage par renforcement dans le raisonnement des grands modèles de langage.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Ce papier présente la Machine de Boltzmann Restreinte Gaussienne-Multinoulli (GM-RBM), une extension du modèle Potts qui remplace les unités cachées binaires par des unités catégorielles à q états pour mieux représenter des concepts multivalués, démontrant ainsi des performances supérieures ou compétitives sur des tâches de mémoire structurée et de rappel analogique par rapport aux modèles continus équivalents.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Le papier propose JULI, une méthode de contournement (jailbreak) des grands modèles de langage qui, en exploitant uniquement les probabilités logarithmiques des tokens via un petit module appelé BiasNet, permet de compromettre efficacement des modèles propriétaires accessibles par API dans un cadre de boîte noire.

Jesson Wang, Zhanhao Hu, David WagnerWed, 11 Ma🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Cet article propose une méthode innovante pour découvrir des équations différentielles symboliques à partir de données en utilisant des invariants de symétrie comme entités atomiques, garantissant ainsi que les lois physiques découvertes respectent les symétries du système tout en améliorant l'efficacité et la précision des algorithmes existants.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose YuWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

L'article présente UltraEdit, une méthode de mise à jour des connaissances dans les grands modèles de langage qui, sans nécessiter de réentraînement, de suivi des sujets ni de mémoire externe, permet une édition en temps réel ultra-rapide et économe en ressources tout en supportant jusqu'à deux millions de modifications grâce à une stratégie de normalisation continue.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Cette étude propose une méthodologie systématique pour évaluer les grands modèles de langage sur des appareils mobiles, démontrant que les modèles volumineux fortement quantifiés surpassent les modèles plus petits à haute précision et offrant des directives pour optimiser leur déploiement dans des environnements aux ressources limitées.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Le papier présente Saturn, un cadre d'apprentissage par renforcement basé sur les problèmes de satisfaisabilité booléenne (SAT) qui surmonte les limitations d'évolutivité, de vérification et de contrôle de difficulté des tâches existantes pour améliorer significativement les capacités de raisonnement des grands modèles de langage.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Le papier présente FrontierCO, un benchmark à grande échelle et fondé sur des structures réelles pour évaluer les solveurs d'optimisation combinatoire par apprentissage automatique, révélant un écart de performance persistant par rapport aux solveurs classiques sur des instances massives tout en identifiant des cas où les méthodes ML surpassent les approches traditionnelles.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Cet article propose SemiCP, une méthode de prédiction conforme semi-supervisée qui améliore la stabilité de la couverture en exploitant des données non étiquetées via un score de non-conformité basé sur l'appariement des plus proches voisins, réduisant ainsi considérablement l'erreur de couverture dans des scénarios à faible étiquetage.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin WeiWed, 11 Ma🤖 cs.LG

Pure Exploration with Infinite Answers

Cet article propose un cadre général, nommé Sticky-Sequence Track-and-Stop, qui résout les problèmes d'exploration pure avec un ensemble infini de réponses possibles et garantit une optimalité asymptotique là où les méthodes existantes échouent.

Riccardo Poiani, Martino Bernasconi, Andrea CelliWed, 11 Ma🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Ce papier présente TSRating, un cadre unifié qui exploite le jugement de grands modèles de langage (LLM) et un apprentissage méta pour évaluer efficacement la qualité de données de séries temporelles provenant de domaines diversifiés, surpassant ainsi les méthodes existantes en précision et en adaptabilité.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Cette présentation propose CORA, une méthode d'attribution de crédit pour l'apprentissage par renforcement multi-agent coopératif qui utilise l'allocation du noyau de la théorie des jeux coopératifs et l'échantillonnage aléatoire de coalitions pour optimiser l'apprentissage des politiques en attribuant les avantages globaux aux stratégies de coalition.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

← Précédent Suivant →