cs.LG Arbeiten | Gist.Science

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

Die Arbeit stellt DIRECTER vor, eine neue Methode zur Aktivierungssteuerung, die durch dynamische, plausibilitätsgeleitete Anpassung der Steuerungsstärke und eine KV-Cache-Skalierung die Instruktionsbefolgung von Large Language Models verbessert, ohne dabei die Textqualität oder Aufgabenfidelität zu beeinträchtigen.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

Die Arbeit stellt ProtAlign vor, ein Multi-Objective-Preference-Alignment-Framework, das vortrainierte Protein-Inverse-Folding-Modelle wie ProteinMPNN durch semi-online Direct Preference Optimization so verfeinert, dass sie gleichzeitig strukturelle Integrität und diverse Entwickelbarkeitseigenschaften wie Löslichkeit und Thermostabilität optimieren.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Die vorgestellte Arbeit schlägt einen latenten Autoencoder-Ensemble-Kalman-Filter (LAE-EnKF) vor, der die Datenassimilation in stark nichtlinearen Systemen verbessert, indem er das Problem in einen gelernten latenten Raum mit stabilen linearen Dynamiken transformiert, was zu höherer Genauigkeit und Stabilität im Vergleich zu herkömmlichen Methoden führt.

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

Diese Arbeit stellt einen hybriden Quanten-Klassischen Autoencoder und Variational Autoencoder vor, der eine Quanten-implizite neuronale Repräsentation (QINR) als Decoder nutzt, um bei der Bildrekonstruktion und -generierung auf Datensätzen wie MNIST eine hohe Detailtreue und Diversität mit begrenzten Parametern zu erreichen und dabei die Stabilitätsprobleme bestehender Quanten-Generativmodelle zu überwinden.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Die Arbeit stellt ICD3 vor, einen interpretierbaren Ansatz zur Erkennung von Konzeptdrift in unausgewogenen Datenströmen, der durch eine granulare Suche und einzelne Cluster-Klassifikatoren den „Maskierungseffekt" großer Cluster vermeidet und Drifts in kleinen Konzepten präzise lokalisiert.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Diese Studie stellt ein mehrstufiges Erklärbarkeitsframework vor, das die Robustheit und Konsistenz von SHAP-Erklärungen für Diagnose- und Prognosemodelle der Alzheimer-Krankheit auf dem NACC-Datensatz quantitativ validiert und zeigt, dass kognitive und funktionelle Marker als stabile, übertragbare Erklärungen dienen.

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Diese Arbeit stellt eine diversitätsbewusste, adaptive Auswahl von Kollokationspunkten für Physics-Informed Neural Networks vor, die das Problem als Sparse-QUBO-Optimierung auf einem kNN-Graphen formuliert, um redundante Punkte zu vermeiden und die Genauigkeit bei reduzierten Trainingskosten zu verbessern.

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Prediction of Steady-State Flow through Porous Media Using Machine Learning Models

Diese Studie zeigt, dass der Fourier-Neural-Operator (FNO) im Vergleich zu herkömmlichen CFD-Methoden und anderen neuronalen Architekturen wie U-Net und Autoencodern eine deutlich schnellere und genauere Vorhersage von Strömungen durch poröse Medien ermöglicht, was ihn besonders für die Topologieoptimierung von Kühlplatten geeignet macht.

Jinhong Wang, Matei C. Ignuta-Ciuncanu, Ricardo F. Martinez-Botas, Teng Cao2026-03-10🤖 cs.LG

Metalearning traffic assignment for network disruptions with graph convolutional neural networks

Die vorgestellte Studie kombiniert Graph-Convolutional-Neural-Networks mit Meta-Learning, um Verkehrsflussvorhersagen auch bei unvorhergesehenen Netzwerkausfällen und veränderten Nachfragemustern schnell anzupassen und dabei eine hohe Genauigkeit (R² ≈ 0,85) zu erreichen.

Serio Agriesti (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Guido Cantelmo (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark), Francisco Camara Pereira (Department of Technology, Management and Economics, Technical University of Denmark, Lyngby, Denmark)2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Diese Studie demonstriert, dass symbolisches maschinelles Lernen im Vergleich zu herkömmlichen Black-Box-Modellen wie Random Forest und Multilayer Perceptron nicht nur eine höhere Vorhersagegenauigkeit bei der Fehlererkennung im Prozess der Ethylenoxidation erzielt, sondern auch durch die Generierung interpretierbarer, regelbasierter Modelle entscheidende Vorteile für die Sicherheit und Entscheidungsunterstützung in der chemischen Industrie bietet.

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

Gauge Freedom and Metric Dependence in Neural Representation Spaces

Die Arbeit zeigt, dass neuronale Repräsentationen nur bis auf invertierbare lineare Transformationen definiert sind, was bedeutet, dass metrikabhängige Ähnlichkeitsmaße wie die Kosinusähnlichkeit ohne Invarianz gegenüber dieser Eichfreiheit irreführend sein können und Analysen stattdessen auf invariante Größen oder kanonische Koordinaten fokussieren sollten.

Jericho Cain2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Die Arbeit stellt den HGT-Scheduler vor, ein auf Deep Reinforcement Learning basierendes Framework, das das Job-Shop-Scheduling-Problem durch die explizite Modellierung als heterogener Graph mittels Heterogeneous Graph Transformer löst und dadurch durch die Berücksichtigung unterschiedlicher Kantentypen eine überlegene Leistung im Vergleich zu homogenen Ansätzen erzielt.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

Der Artikel stellt SpatialMAGIC vor, ein hybrides Framework, das Graph-Diffusion und räumliche Aufmerksamkeit kombiniert, um die durch technische Rauschsignale und hohe Sparsität beeinträchtigten Daten der räumlichen Transkriptomik zu vervollständigen und dabei sowohl die Gewebe-Architektur als auch die biologische Interpretierbarkeit zu erhalten.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Das Paper stellt xaitimesynth vor, ein Open-Source-Python-Paket, das durch die Generierung synthetischer Zeitreihen mit bekannter Ground Truth eine standardisierte Infrastruktur zur Evaluierung von Attribution-Methoden für Zeitreihen bereitstellt.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Dieser Beitrag stellt ein physikbasiertes Diffusionsmodell vor, das mittels der Context-UNet-Architektur und atmosphärischer Konditionierung synthetische, physikalisch konsistente Satellitenbilder extremer Wetterereignisse generiert, um das Problem des Datenmangels bei seltenen tropischen Wirbelstürmen zu lösen und maschinelles Lernen für deren Erkennung zu verbessern.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

Die Arbeit stellt die Optimistic Policy Regularization (OPR) vor, einen leichten Mechanismus, der durch die Speicherung und gezielte Nachahmung historisch erfolgreicher Trajektorien das vorzeitige Konvergieren von Deep-Reinforcement-Learning-Agenten verhindert und so sowohl die Sample-Effizienz als auch die Endleistung auf Atari-Spielen und im Cyber-Defense-Bereich signifikant verbessert.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Die Arbeit stellt „Best-of-Tails" (BoT) vor, ein adaptives Inferenzzeit-Alignierungs-Framework, das durch die Analyse der Reward-Verteilung mit dem Hill-Schätzer und die Verwendung von Tsallis-Divergenz als regulärisierendem Faktor dynamisch zwischen optimistischen und pessimistischen Strategien wechselt, um das Dilemma zwischen Belohnungshacking und notwendiger Exploration zu lösen.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

NEST: Network- and Memory-Aware Device Placement For Distributed Deep Learning

Die Arbeit stellt NEST vor, ein Framework für das Gerätelayout im verteilten Deep Learning, das durch strukturierte dynamische Programmierung Parallelismus, Speicherkapazität und Netzwerktopologie gemeinsam optimiert und damit im Vergleich zu bestehenden Methoden eine bis zu 2,43-fach höhere Durchsatzleistung sowie verbesserte Skalierbarkeit und Speichereffizienz erzielt.

Irene Wang, Vishnu Varma Venkata, Arvind Krishnamurthy, Divya Mahajan2026-03-10🤖 cs.LG

Multi-Agent Reinforcement Learning with Submodular Reward

Diese Arbeit stellt ein neues Rahmenwerk für kooperatives Multi-Agenten-Reinforcement-Learning mit submodularen Belohnungen vor, das durch greedy-Optimierung bei bekannten Dynamiken und einen UCB-basierten Algorithmus bei unbekannten Dynamiken effiziente Algorithmen mit nachweisbaren Approximations- und Regret-Garantien bietet.

Wenjing Chen, Chengyuan Qian, Shuo Xing, Yi Zhou, Victoria Crawford2026-03-10🤖 cs.LG

CREDO: Epistemic-Aware Conformalized Credal Envelopes for Regression

Das Paper stellt CREDO vor, eine Methode, die durch die Kombination von credalen Envelopes zur Darstellung epistemischer Unsicherheit und konformaler Kalibrierung für garantierte Abdeckung interpretierbare und effiziente Regressionsintervalle erzeugt, deren Breite sich in aleatorisches Rauschen, epistemische Inflation und einen kalibrierungsbedingten Spielraum zerlegen lässt.

Luben M. C. Cabezas, Sabina J. Sloman, Bruno M. Resende, Fanyi Wu, Michele Caprio, Rafael Izbicki2026-03-10🤖 cs.LG

← Zurück Weiter →