cs.LG papers | Gist.Science

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Dit paper introduceert een unificerend kader om te evalueren hoe personalisatie van machine learning-modellen zowel voorspellingen als uitleg beïnvloedt, waarbij wordt aangetoond dat deze effecten kunnen divergeren en dat de haalbaarheid van het testen van dergelijke effecten afhangt van specifieke datasetkenmerken.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina MiolaneWed, 11 Ma🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Dit artikel introduceert het concept van een 'ruimtelijke signatuur' voor datasets om de robuustheid van semivalue-gebaseerde datawaardering tegen veranderingen in de nuttigheidsfunctie te analyseren en biedt een praktische methode om de stabiliteit van deze waarderingen te kwantificeren.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Deze paper presenteert een geïntegreerd framework dat likelihood-free inference gebruikt om fysische parameters van vervormbare lineaire objecten te schatten, waarmee domeinrandomisatie in simulatie wordt verbeterd voor het trainen van visuele beleidsstrategieën die zonder aanpassing direct in de echte wereld kunnen worden ingezet.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Dit paper introduceert de Feature Importance Rescaling (FIR)-methode, die de betrouwbaarheid van clustervalidatie in ruisrijke Gaussische mengsels verbetert door de bijdrage van ruisfeatures te verminderen, waardoor de correlatie met de grondwaarheid toeneemt.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Dit paper introduceert HyConEx, een innovatief diep leermodel voor tabulaire data dat gelijktijdig nauwkeurige classificaties en lokale uitleggen in de vorm van contrafactuele voorbeelden biedt, waardoor het de eerste interpreteerbare classifier is die beide functies in één neurale netwerkbouwkundige combineert.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

Experiments with Optimal Model Trees

Dit artikel onderzoekt empirisch of modelbomen met lineaire support vector machines in de bladeren, die via gemengd-gehele lineaire programmering globaal optimaal worden geconstrueerd, concurrerende nauwkeurigheid kunnen bieden met zeer kleine en interpreteerbare bomen in vergelijking met traditionele, lokaal optimale algoritmen.

Sabino Francesco Roselli, Eibe FrankWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Dit paper pleit vanuit een consequentiaalistisch perspectief voor het gebruik van proper scoring rules in plaats van binaire classificatiemetrics, onderbouwd met een theoretisch kader, een empirische analyse van huidige praktijken en de introductie van het Python-pakket `briertools` om deze aanpak toegankelijker te maken.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Dit artikel introduceert CDGLT, een trainings-efficiënt framework voor multimodaal metafoorherkenning dat gebruikmaakt van conceptdrift en LayerNorm-tuning om de kloof tussen letterlijke en figuurlijke interpretaties te overbruggen en state-of-the-art prestaties te behalen op de MET-Meme-benchmark.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia LiWed, 11 Ma🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Dit paper introduceert Stepwise Guided Policy Optimization (SGPO), een framework dat het probleem van volledig negatieve steekproefgroepen in GRPO oplost door gebruik te maken van een stapsgewijze beoordelaar voor diversiteit, waardoor het model effectief kan leren van fouten zonder dat de beoordelaar zelf correcte oplossingen hoeft te genereren.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Dit paper introduceert de Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM), een energiegebaseerd generatief model dat de standaard GB-RBM uitbreidt met q-staats categorische (Potts) verborgen eenheden om discrete, gestructureerde representaties te leren, en toont aan dat dit model bij gelijke capaciteit concurrerende of betere resultaten bereikt op analogie- en geheugenopdrachten vergeleken met binaire latente modellen.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Dit paper introduceert JULI, een methode die zwarte-doos Large Language Models via een plug-in genaamd BiasNet en manipulatie van token-logkansen, zelfs met slechts de top-5 voorspellingen, succesvol kan omzeilen zonder toegang tot modelgewichten.

Jesson Wang, Zhanhao Hu, David WagnerWed, 11 Ma🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Dit artikel introduceert een nieuwe methode voor het ontdekken van symbolische differentiaalvergelijkingen uit data door het gebruik van symmetrie-invarianten als atomaire eenheden, wat ervoor zorgt dat de gevonden vergelijkingen fysische wetten eerbiedigen en de zoekruimte efficiënter wordt.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose YuWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Dit paper introduceert UltraEdit, een trainings-, onderwerp- en geheugenloze methode voor het levenslang bijwerken van taalmodellen die aanzienlijk sneller en minder geheugenintensief is dan bestaande technieken, waardoor het zelfs op consumentenhardware mogelijk wordt om miljoenen bewerkingen uit te voeren zonder bestaande vaardigheden te verliezen.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Deze studie introduceert een systematische methode om on-device LLM's te evalueren en concludeert dat zwaar gekwantiseerde grotere modellen vaak beter presteren dan kleinere, hogere precisie-modellen, met een prestatiedrempel van ongeveer 3,5 bits per gewicht.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Het paper introduceert SATURN, een reinforcement learning-framework dat gebruikmaakt van Boolean Satisfiability-problemen om de redeneercapaciteit van grote taalmodellen schaalbaar, verifieerbaar en met gecontroleerde moeilijkheidsgraad te trainen via een curriculum learning-aanpak.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Het paper introduceert FrontierCO, een uitgebreid benchmark voor het evalueren van machine learning-oplossers voor combinatorische optimalisatie op realistische, industriële schaal, waarbij een aanhoudende prestatiekloof wordt aangetoond ten opzichte van klassieke methoden, hoewel er specifieke scenario's zijn waarin ML-methoden beter presteren.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Deze paper introduceert SemiCP, een semi-superviserde methode voor conformele voorspelling die ongelabelde data via een 'Nearest Neighbor Matching'-score benut om de stabiliteit en dekking van voorspellingen te verbeteren wanneer gelabelde data schaars is.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin WeiWed, 11 Ma🤖 cs.LG

Pure Exploration with Infinite Answers

Dit artikel introduceert het 'Sticky-Sequence Track-and-Stop'-framework voor zuivere exploratieproblemen met oneindig veel mogelijke antwoorden, wat leidt tot asymptotische optimaliteit waar bestaande methoden tekortschieten.

Riccardo Poiani, Martino Bernasconi, Andrea CelliWed, 11 Ma🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Dit paper introduceert TSRating, een uniek raamwerk dat meta-learning en Large Language Models combineert om de kwaliteit van tijdreeksdata uit diverse domeinen nauwkeurig en efficiënt te beoordelen.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Dit paper introduceert CORA, een methode voor credit assignment in multi-agent reinforcement learning die gebruikmaakt van coöperatieve speltheorie en kernallocatie om agenten effectiever te belonen op basis van hun coalitiële bijdragen, wat leidt tot verbeterde gecoördineerde prestaties.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

← Vorige Volgende →