A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Deze paper presenteert een geïntegreerd framework dat likelihood-free inference gebruikt om fysische parameters van vervormbare lineaire objecten te schatten, waarmee domeinrandomisatie in simulatie wordt verbeterd voor het trainen van visuele beleidsstrategieën die zonder aanpassing direct in de echte wereld kunnen worden ingezet.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Dit paper introduceert HyConEx, een innovatief diep leermodel voor tabulaire data dat gelijktijdig nauwkeurige classificaties en lokale uitleggen in de vorm van contrafactuele voorbeelden biedt, waardoor het de eerste interpreteerbare classifier is die beide functies in één neurale netwerkbouwkundige combineert.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Dit paper pleit vanuit een consequentiaalistisch perspectief voor het gebruik van proper scoring rules in plaats van binaire classificatiemetrics, onderbouwd met een theoretisch kader, een empirische analyse van huidige praktijken en de introductie van het Python-pakket `briertools` om deze aanpak toegankelijker te maken.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Dit paper introduceert de Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM), een energiegebaseerd generatief model dat de standaard GB-RBM uitbreidt met q-staats categorische (Potts) verborgen eenheden om discrete, gestructureerde representaties te leren, en toont aan dat dit model bij gelijke capaciteit concurrerende of betere resultaten bereikt op analogie- en geheugenopdrachten vergeleken met binaire latente modellen.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Dit paper introduceert UltraEdit, een trainings-, onderwerp- en geheugenloze methode voor het levenslang bijwerken van taalmodellen die aanzienlijk sneller en minder geheugenintensief is dan bestaande technieken, waardoor het zelfs op consumentenhardware mogelijk wordt om miljoenen bewerkingen uit te voeren zonder bestaande vaardigheden te verliezen.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Deze studie introduceert een systematische methode om on-device LLM's te evalueren en concludeert dat zwaar gekwantiseerde grotere modellen vaak beter presteren dan kleinere, hogere precisie-modellen, met een prestatiedrempel van ongeveer 3,5 bits per gewicht.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Het paper introduceert FrontierCO, een uitgebreid benchmark voor het evalueren van machine learning-oplossers voor combinatorische optimalisatie op realistische, industriële schaal, waarbij een aanhoudende prestatiekloof wordt aangetoond ten opzichte van klassieke methoden, hoewel er specifieke scenario's zijn waarin ML-methoden beter presteren.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG