cs.LG Arbeiten | Gist.Science

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Die Arbeit stellt ein einheitliches Framework vor, um zu quantifizieren, wie sich Personalisierung auf Vorhersagegenauigkeit und Erklärbarkeit auswirkt, und leitet statistische Grenzen ab, die aufzeigen, wann solche Effekte in realen Datensätzen überhaupt noch testbar sind.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina MiolaneWed, 11 Ma🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Diese Arbeit führt das Konzept der räumlichen Signatur von Datensätzen ein, um die Robustheit semivalu-basierter Datenbewertung gegenüber Änderungen der Nutzenfunktion zu analysieren und eine praktische Methodik zur Quantifizierung dieser Stabilität zu entwickeln.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Diese Arbeit stellt einen integrierten Rahmen vor, der likelihood-freie Inferenz nutzt, um physikalische Parameter deformierbarer linearer Objekte aus visuellen und propriozeptiven Daten zu schätzen und so durch domänenrandomisierte, modellfreie Verstärkungslernen in der Simulation trainierte visuomotorische Strategien für eine Zero-Shot-Übertragung auf reale Manipulationsaufgaben zu ermöglichen.

Georgios Kamaras, Subramanian RamamoorthyWed, 11 Ma🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

Die vorgestellte Arbeit führt die theoretisch fundierte Feature Importance Rescaling (FIR)-Methode ein, welche durch eine gewichtete Anpassung der Merkmalsbeiträge die Zuverlässigkeit von Cluster-Validierungsindizes in verrauschten Gaußschen Mischmodellen signifikant verbessert und deren Übereinstimmung mit der Grundwahrheit auch bei überlappenden Clustern erhöht.

Renato Cordeiro de Amorim, Vladimir MakarenkovWed, 11 Ma🤖 cs.LG

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

Experiments with Optimal Model Trees

Diese Studie untersucht empirisch die Leistungsfähigkeit von global optimalen Modellbäumen mit linearen Support-Vektor-Maschinen in den Blattknoten, die mittels gemischt-ganzzahliger linearer Programmierung gelernt werden, und zeigt, dass diese im Vergleich zu gierig konstruierten Bäumen und anderen Algorithmen bei gleichzeitig hoher Interpretierbarkeit wettbewerbsfähige Genauigkeit mit sehr kleinen Baumstrukturen erreichen.

Sabino Francesco Roselli, Eibe FrankWed, 11 Ma🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Die Arbeit stellt CDGLT vor, ein rechen-effizientes Framework zur Identifizierung multimodaler Metaphern, das durch den Einsatz von Konzept-Drift und angepasstem LayerNorm-Tuning einen neuen State-of-the-Art auf dem MET-Meme-Benchmark erreicht.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia LiWed, 11 Ma🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Die Arbeit stellt SGPO vor, einen neuen Ansatz, der die Lernfähigkeit von GRPO verbessert, indem er durch einen schrittweisen Bewertungsmodell die Lernsignale aus Gruppen vollständig falscher Antworten nutzbar macht, anstatt sie zu verwerfen.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Die vorgestellte Arbeit führt das Gaussian-Multinoulli Restricted Boltzmann Machine (GM-RBM) ein, ein generatives Energie-basiertes Modell, das durch den Ersatz binärer durch q-stufige kategorische (Potts-)Einheiten eine reichhaltigere latente Repräsentation für diskrete Konzepte ermöglicht und auf Benchmarks für analogisches Abrufen sowie strukturiertes Gedächtnis eine konkurrenzfähige bis verbesserte Leistung bei gleicher Kapazität und vergleichbaren Trainingskosten erzielt.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke TheogarajanWed, 11 Ma🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

Die Arbeit stellt JULI vor, eine neue Angriffsmethode, die große Sprachmodelle im Black-Box-Setting allein durch die Manipulation der Token-Wahrscheinlichkeiten unter Verwendung eines kleinen Plug-ins namens BiasNet umgeht, ohne Zugriff auf die Modellgewichte zu benötigen.

Jesson Wang, Zhanhao Hu, David WagnerWed, 11 Ma🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Diese Arbeit stellt eine Methode vor, die Symmetrieinvarianten als atomare Einheiten in die Entdeckung symbolischer Differentialgleichungen integriert, um die Suche effizienter zu gestalten und sicherzustellen, dass die gefundenen Gleichungen physikalische Symmetrien einhalten.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose YuWed, 11 Ma🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Die Studie stellt eine systematische Evaluierung von On-Device-LLMs auf handelsüblicher Hardware vor und zeigt, dass stark quantisierte große Modelle (ab ca. 3,5 effektiven Bits pro Gewicht) kleineren Modellen überlegen sind, während sie gleichzeitig Richtlinien für die Optimierung unter Ressourcenbeschränkungen bietet.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong XuWed, 11 Ma🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Das Paper stellt SATURN vor, ein Reinforcement-Learning-Framework, das mithilfe von SAT-Problemen (Boolean Satisfiability) eine skalierbare, verifizierbare und präzise steuerbare Lernkurve ermöglicht, um die reasoning-Fähigkeiten von LLMs von einfachen zu komplexen Aufgaben systematisch zu verbessern.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

Das Paper stellt FrontierCO vor, ein umfassendes Benchmark-System zur realistischen und großskaligen Evaluierung von maschinellen Lernverfahren für kombinatorische Optimierungsprobleme, das eine signifikante Leistungslücke gegenüber klassischen Solvern aufzeigt, während es gleichzeitig spezifische Anwendungsfälle identifiziert, in denen ML-Methoden überlegen sind.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming YangWed, 11 Ma🤖 cs.LG

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

Die Arbeit stellt SemiCP vor, ein semi-überwachtes konformes Vorhersageverfahren, das durch die Einführung eines Nearest-Neighbor-Matching-Scores für ungelabelte Daten die Kalibrierung verbessert und bei begrenzten gelabelten Daten die Abdeckungsgenauigkeit signifikant erhöht.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin WeiWed, 11 Ma🤖 cs.LG

Pure Exploration with Infinite Answers

Dieses Paper stellt mit „Sticky-Sequence Track-and-Stop" einen neuartigen Rahmen für reine Exploration bei möglicherweise unendlich vielen korrekten Antworten vor, der die Asymptotische Optimalität bestehender Methoden für endliche Antworträume erweitert und deren Versagen in diesem allgemeineren Setting analysiert.

Riccardo Poiani, Martino Bernasconi, Andrea CelliWed, 11 Ma🤖 cs.LG

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Das Paper stellt TSRating vor, ein neuartiges Meta-Learning-Framework, das die Qualität von Zeitreihendaten aus unterschiedlichen Domänen bewertet, indem es die Urteilsfähigkeit von Large Language Models nutzt und durch effiziente Meta-Learning-Verfahren in eine skalierbare Bewertungsmethode überführt.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

← Zurück Weiter →