cs.LG Arbeiten | Gist.Science

Astromer 2

Der Artikel stellt Astromer 2 vor, ein verbessertes vortrainiertes fundamentales Modell für Lichtkurven, das durch selbstüberwachtes Lernen auf 1,5 Millionen MACHO-Datenströmen signifikant bessere Klassifikationsergebnisse als sein Vorgänger erzielt und sich besonders bei geringen Mengen an gelabelten Daten bewährt.

Cristobal Donoso-Oliva, Ignacio Becker, Pavlos Protopapas + 3 more2026-03-11🔭 astro-ph

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Die Arbeit stellt ein einheitliches Framework vor, um zu quantifizieren, wie sich Personalisierung auf Vorhersagegenauigkeit und Erklärbarkeit auswirkt, und leitet statistische Grenzen ab, die aufzeigen, wann solche Effekte in realen Datensätzen überhaupt noch testbar sind.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina Miolane2026-03-11🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Diese Arbeit führt das Konzept der räumlichen Signatur von Datensätzen ein, um die Robustheit semivalu-basierter Datenbewertung gegenüber Änderungen der Nutzenfunktion zu analysieren und eine praktische Methodik zur Quantifizierung dieser Stabilität zu entwickeln.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick Loiseau2026-03-11🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Diese Arbeit stellt einen integrierten Rahmen vor, der likelihood-freie Inferenz nutzt, um physikalische Parameter deformierbarer linearer Objekte aus visuellen und propriozeptiven Daten zu schätzen und so durch domänenrandomisierte, modellfreie Verstärkungslernen in der Simulation trainierte visuomotorische Strategien für eine Zero-Shot-Übertragung auf reale Manipulationsaufgaben zu ermöglichen.

Georgios Kamaras, Subramanian Ramamoorthy2026-03-11🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Die vorgestellte Arbeit führt die theoretisch fundierte Feature Importance Rescaling (FIR)-Methode ein, welche durch eine gewichtete Anpassung der Merkmalsbeiträge die Zuverlässigkeit von Cluster-Validierungsindizes in verrauschten Gaußschen Mischmodellen signifikant verbessert und deren Übereinstimmung mit der Grundwahrheit auch bei überlappenden Clustern erhöht.

Renato Cordeiro de Amorim, Vladimir Makarenkov2026-03-11🤖 cs.LG

Functional Unit: A New Perspective on Materials Science Research Paradigms

Dieser Perspektivartikel führt das Konzept der funktionalen Einheiten ein, um die Lücke zwischen traditionellen Struktur-Eigenschafts-Korrelationen und datengesteuerten KI-Ansätzen in der Materialwissenschaft zu schließen und so die Evolution von der „Prozess-Struktur-Eigenschafts-Leistung"-Paradigmen hin zu einem integrierten, KI-gestützten Forschungsrahmen zu unterstützen.

Caichao Ye, Tao Feng, Weishu Liu + 1 more2026-03-11🔬 cond-mat.mtrl-sci

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek Smieja2026-03-11🤖 cs.AI

Experiments with Optimal Model Trees

Diese Studie untersucht empirisch die Leistungsfähigkeit von global optimalen Modellbäumen mit linearen Support-Vektor-Maschinen in den Blattknoten, die mittels gemischt-ganzzahliger linearer Programmierung gelernt werden, und zeigt, dass diese im Vergleich zu gierig konstruierten Bäumen und anderen Algorithmen bei gleichzeitig hoher Interpretierbarkeit wettbewerbsfähige Genauigkeit mit sehr kleinen Baumstrukturen erreichen.

Sabino Francesco Roselli, Eibe Frank2026-03-11🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. Wilson2026-03-11🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Die Arbeit stellt CDGLT vor, ein rechen-effizientes Framework zur Identifizierung multimodaler Metaphern, das durch den Einsatz von Konzept-Drift und angepasstem LayerNorm-Tuning einen neuen State-of-the-Art auf dem MET-Meme-Benchmark erreicht.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia Li2026-03-11🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Die Arbeit stellt SGPO vor, einen neuen Ansatz, der die Lernfähigkeit von GRPO verbessert, indem er durch einen schrittweisen Bewertungsmodell die Lernsignale aus Gruppen vollständig falscher Antworten nutzbar macht, anstatt sie zu verwerfen.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi Lin2026-03-11🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Die vorgestellte Arbeit führt das Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM) ein, ein generatives Energie-basiertes Modell, das durch den Ersatz binärer durch q-stufige kategorische (Potts-)Einheiten eine reichhaltigere latente Repräsentation für diskrete Konzepte ermöglicht und auf Benchmarks für analogisches Abrufen sowie strukturiertes Gedächtnis eine konkurrenzfähige bis verbesserte Leistung bei gleicher Kapazität und vergleichbaren Trainingskosten erzielt.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke Theogarajan2026-03-11🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Die Arbeit stellt JULI vor, eine neue Angriffsmethode, die große Sprachmodelle im Black-Box-Setting allein durch die Manipulation der Token-Wahrscheinlichkeiten unter Verwendung eines kleinen Plug-ins namens BiasNet umgeht, ohne Zugriff auf die Modellgewichte zu benötigen.

Jesson Wang, Zhanhao Hu, David Wagner2026-03-11🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Diese Arbeit stellt eine Methode vor, die Symmetrieinvarianten als atomare Einheiten in die Entdeckung symbolischer Differentialgleichungen integriert, um die Suche effizienter zu gestalten und sicherzustellen, dass die gefundenen Gleichungen physikalische Symmetrien einhalten.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose Yu2026-03-11🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Die Studie stellt eine systematische Evaluierung von On-Device-LLMs auf handelsüblicher Hardware vor und zeigt, dass stark quantisierte große Modelle (ab ca. 3,5 effektiven Bits pro Gewicht) kleineren Modellen überlegen sind, während sie gleichzeitig Richtlinien für die Optimierung unter Ressourcenbeschränkungen bietet.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong Xu2026-03-11🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Das Paper stellt SATURN vor, ein Reinforcement-Learning-Framework, das mithilfe von SAT-Problemen (Boolean Satisfiability) eine skalierbare, verifizierbare und präzise steuerbare Lernkurve ermöglicht, um die reasoning-Fähigkeiten von LLMs von einfachen zu komplexen Aufgaben systematisch zu verbessern.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong Dong2026-03-11🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Das Paper stellt FrontierCO vor, ein umfassendes Benchmark-System zur realistischen und großskaligen Evaluierung von maschinellen Lernverfahren für kombinatorische Optimierungsprobleme, das eine signifikante Leistungslücke gegenüber klassischen Solvern aufzeigt, während es gleichzeitig spezifische Anwendungsfälle identifiziert, in denen ML-Methoden überlegen sind.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming Yang2026-03-11🤖 cs.LG

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Diese systematische Übersicht untersucht die Integration von Foundation-Modellen in mobile Serviceroboter, indem sie technische Fortschritte bei der Aufgabenausführung und multimodalen Wahrnehmung analysiert, reale Anwendungsbereiche beleuchtet und ethische sowie zukünftige Forschungsfragen im Kontext sicherer und vertrauenswürdiger Mensch-Roboter-Interaktionen diskutiert.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Die Arbeit stellt SemiCP vor, ein semi-überwachtes konformes Vorhersageverfahren, das durch die Einführung eines Nearest-Neighbor-Matching-Scores für ungelabelte Daten die Kalibrierung verbessert und bei begrenzten gelabelten Daten die Abdeckungsgenauigkeit signifikant erhöht.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin Wei2026-03-11🤖 cs.LG

← Zurück Weiter →