A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Diese Arbeit stellt einen integrierten Rahmen vor, der likelihood-freie Inferenz nutzt, um physikalische Parameter deformierbarer linearer Objekte aus visuellen und propriozeptiven Daten zu schätzen und so durch domänenrandomisierte, modellfreie Verstärkungslernen in der Simulation trainierte visuomotorische Strategien für eine Zero-Shot-Übertragung auf reale Manipulationsaufgaben zu ermöglichen.

Georgios Kamaras, Subramanian Ramamoorthy2026-03-11🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Die vorgestellte Arbeit führt die theoretisch fundierte Feature Importance Rescaling (FIR)-Methode ein, welche durch eine gewichtete Anpassung der Merkmalsbeiträge die Zuverlässigkeit von Cluster-Validierungsindizes in verrauschten Gaußschen Mischmodellen signifikant verbessert und deren Übereinstimmung mit der Grundwahrheit auch bei überlappenden Clustern erhöht.

Renato Cordeiro de Amorim, Vladimir Makarenkov2026-03-11🤖 cs.LG

Functional Unit: A New Perspective on Materials Science Research Paradigms

Dieser Perspektivartikel führt das Konzept der funktionalen Einheiten ein, um die Lücke zwischen traditionellen Struktur-Eigenschafts-Korrelationen und datengesteuerten KI-Ansätzen in der Materialwissenschaft zu schließen und so die Evolution von der „Prozess-Struktur-Eigenschafts-Leistung"-Paradigmen hin zu einem integrierten, KI-gestützten Forschungsrahmen zu unterstützen.

Caichao Ye, Tao Feng, Weishu Liu + 1 more2026-03-11🔬 cond-mat.mtrl-sci

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek Smieja2026-03-11🤖 cs.AI

Experiments with Optimal Model Trees

Diese Studie untersucht empirisch die Leistungsfähigkeit von global optimalen Modellbäumen mit linearen Support-Vektor-Maschinen in den Blattknoten, die mittels gemischt-ganzzahliger linearer Programmierung gelernt werden, und zeigt, dass diese im Vergleich zu gierig konstruierten Bäumen und anderen Algorithmen bei gleichzeitig hoher Interpretierbarkeit wettbewerbsfähige Genauigkeit mit sehr kleinen Baumstrukturen erreichen.

Sabino Francesco Roselli, Eibe Frank2026-03-11🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. Wilson2026-03-11🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Die vorgestellte Arbeit führt das Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM) ein, ein generatives Energie-basiertes Modell, das durch den Ersatz binärer durch q-stufige kategorische (Potts-)Einheiten eine reichhaltigere latente Repräsentation für diskrete Konzepte ermöglicht und auf Benchmarks für analogisches Abrufen sowie strukturiertes Gedächtnis eine konkurrenzfähige bis verbesserte Leistung bei gleicher Kapazität und vergleichbaren Trainingskosten erzielt.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke Theogarajan2026-03-11🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Die Studie stellt eine systematische Evaluierung von On-Device-LLMs auf handelsüblicher Hardware vor und zeigt, dass stark quantisierte große Modelle (ab ca. 3,5 effektiven Bits pro Gewicht) kleineren Modellen überlegen sind, während sie gleichzeitig Richtlinien für die Optimierung unter Ressourcenbeschränkungen bietet.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong Xu2026-03-11🤖 cs.LG

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Das Paper stellt FrontierCO vor, ein umfassendes Benchmark-System zur realistischen und großskaligen Evaluierung von maschinellen Lernverfahren für kombinatorische Optimierungsprobleme, das eine signifikante Leistungslücke gegenüber klassischen Solvern aufzeigt, während es gleichzeitig spezifische Anwendungsfälle identifiziert, in denen ML-Methoden überlegen sind.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming Yang2026-03-11🤖 cs.LG

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Diese systematische Übersicht untersucht die Integration von Foundation-Modellen in mobile Serviceroboter, indem sie technische Fortschritte bei der Aufgabenausführung und multimodalen Wahrnehmung analysiert, reale Anwendungsbereiche beleuchtet und ethische sowie zukünftige Forschungsfragen im Kontext sicherer und vertrauenswürdiger Mensch-Roboter-Interaktionen diskutiert.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL