A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Diese Arbeit stellt einen integrierten Rahmen vor, der likelihood-freie Inferenz nutzt, um physikalische Parameter deformierbarer linearer Objekte aus visuellen und propriozeptiven Daten zu schätzen und so durch domänenrandomisierte, modellfreie Verstärkungslernen in der Simulation trainierte visuomotorische Strategien für eine Zero-Shot-Übertragung auf reale Manipulationsaufgaben zu ermöglichen.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Die vorgestellte Arbeit führt die theoretisch fundierte Feature Importance Rescaling (FIR)-Methode ein, welche durch eine gewichtete Anpassung der Merkmalsbeiträge die Zuverlässigkeit von Cluster-Validierungsindizes in verrauschten Gaußschen Mischmodellen signifikant verbessert und deren Übereinstimmung mit der Grundwahrheit auch bei überlappenden Clustern erhöht.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

Experiments with Optimal Model Trees

Diese Studie untersucht empirisch die Leistungsfähigkeit von global optimalen Modellbäumen mit linearen Support-Vektor-Maschinen in den Blattknoten, die mittels gemischt-ganzzahliger linearer Programmierung gelernt werden, und zeigt, dass diese im Vergleich zu gierig konstruierten Bäumen und anderen Algorithmen bei gleichzeitig hoher Interpretierbarkeit wettbewerbsfähige Genauigkeit mit sehr kleinen Baumstrukturen erreichen.

Sabino Francesco Roselli, Eibe FrankWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Die vorgestellte Arbeit führt das Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM) ein, ein generatives Energie-basiertes Modell, das durch den Ersatz binärer durch q-stufige kategorische (Potts-)Einheiten eine reichhaltigere latente Repräsentation für diskrete Konzepte ermöglicht und auf Benchmarks für analogisches Abrufen sowie strukturiertes Gedächtnis eine konkurrenzfähige bis verbesserte Leistung bei gleicher Kapazität und vergleichbaren Trainingskosten erzielt.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Die Studie stellt eine systematische Evaluierung von On-Device-LLMs auf handelsüblicher Hardware vor und zeigt, dass stark quantisierte große Modelle (ab ca. 3,5 effektiven Bits pro Gewicht) kleineren Modellen überlegen sind, während sie gleichzeitig Richtlinien für die Optimierung unter Ressourcenbeschränkungen bietet.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Das Paper stellt FrontierCO vor, ein umfassendes Benchmark-System zur realistischen und großskaligen Evaluierung von maschinellen Lernverfahren für kombinatorische Optimierungsprobleme, das eine signifikante Leistungslücke gegenüber klassischen Solvern aufzeigt, während es gleichzeitig spezifische Anwendungsfälle identifiziert, in denen ML-Methoden überlegen sind.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI