cs.LG Arbeiten | Gist.Science

On the Learnability of Offline Model-Based Optimization: A Ranking Perspective

Diese Arbeit stellt die Annahme in Frage, dass hohe Vorhersagegenauigkeit für Offline-Modellbasierte Optimierung ausreicht, und beweist theoretisch sowie empirisch, dass ein rankingbasierter Ansatz, der die Verteilungsunterschiede zwischen Trainingsdaten und optimalen Designs berücksichtigt, überlegene Ergebnisse liefert, während sie gleichzeitig inhärente Grenzen der Methode aufzeigt.

Shen-Huan Lyu, Rong-Xi Tan, Ke Xue + 4 more2026-03-05🤖 cs.LG

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Diese Arbeit stellt einen trainingsfreien Framework vor, der vortrainierte Diffusionsmodelle in Kombination mit einem Reverse Channel Coding-Modul und einem skalierten Score-Flow-ODE-Dekodierer nutzt, um die gesamte Rate-Distortion-Perception-Fläche theoretisch fundiert und empirisch effektiv zu durchlaufen.

Yuhan Wang, Suzhi Bi, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Die Autoren stellen für das Problem der Identifizierung des besten Arms in gruppierten Banditen unter festen Budgets eine neue untere Schranke für die Fehlerwahrscheinlichkeit vor und entwickeln den Algorithmus FCSR, der sowohl die Machbarkeitsbedingungen erfüllt als auch eine optimale Abhängigkeit von den Problemparametern erreicht.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Continuous Modal Logical Neural Networks: Modal Reasoning via Stochastic Accessibility

Die Arbeit stellt Fluid Logic und Continuous Modal Logical Neural Networks (CMLNNs) vor, ein Paradigma, das modale logische Schlussfolgerungen durch stochastische Differentialgleichungen auf kontinuierliche Mannigfaltigkeiten überträgt, um logisch konsistente neuronale Netzwerke für Anwendungen wie Halluzinationserkennung, geometrische Rekonstruktion und sichere Steuerung zu ermöglichen.

Antonin Sulc2026-03-05🤖 cs.LG

A Multi-Dimensional Quality Scoring Framework for Decentralized LLM Inference with Proof of Quality

Diese Arbeit stellt ein mehrdimensionales Framework zur Bewertung der Ausgabequalität bei dezentraler LLM-Inferenz vor, das durch systematische Kalibrierung und Gewichtung zuverlässiger Dimensionen eine robuste, adversariefeste Qualitätsbewertung für Proof-of-Quality-Mechanismen ermöglicht.

Arther Tian, Alex Ding, Frank Chen + 2 more2026-03-05🤖 cs.AI

Multi-Stage Music Source Restoration with BandSplit-RoFormer Separation and HiFi++ GAN

Dieser technische Bericht stellt das System des CP-JKU-Teams für den MSR ICASSP Challenge 2025 vor, das Musikquellen-Wiederherstellung durch eine mehrstufige Pipeline aus einem BandSplit-RoFormer-Trenner mit Curriculum-Learning und einem spezialisierten HiFi++ GAN-Waveform-Restorer realisiert.

Tobias Morocutti, Emmanouil Karystinaios, Jonathan Greif + 1 more2026-03-05🤖 cs.LG

DQE-CIR: Distinctive Query Embeddings through Learnable Attribute Weights and Target Relative Negative Sampling in Composed Image Retrieval

Die Arbeit stellt DQE-CIR vor, eine Methode zur kompositen Bildsuche, die durch lernbare Attributgewichte und ein zielrelatives negatives Sampling die Diskriminativität von Abfrage-Embeddings verbessert, um Relevanzunterdrückung und semantische Verwirrung in bestehenden kontrastiven Lernrahmen zu überwinden.

Geon Park, Ji-Hoon Park, Seong-Whan Lee2026-03-05🤖 cs.AI

Inference-Time Toxicity Mitigation in Protein Language Models

Die Studie stellt Logit Diff Amplification (LDA) als eine retraining-freie Methode zur Inference-Time-Steuerung vor, die die Erzeugung toxischer Proteine in taxonomisch adaptierten Protein-Sprachmodellen effektiv reduziert, ohne dabei deren biologische Plausibilität oder strukturelle Integrität zu beeinträchtigen.

Manuel Fernández Burda, Santiago Aranguri, Iván Arcuschin Moreno + 1 more2026-03-05🤖 cs.AI

Fermi-Dirac thermal measurements: A framework for quantum hypothesis testing and semidefinite optimization

Die Arbeit stellt ein neues Rahmenwerk vor, das Quantenmessungen als Fermionen interpretiert und durch die Minimierung der freien Fermi-Dirac-Energie sowohl optimierte Hypothesentests als auch eine neuartige Methode zur Lösung semidefiniter Optimierungsprobleme auf Quantencomputern ermöglicht.

Nana Liu, Mark M. Wilde2026-03-05⚛️ quant-ph

FedCova: Robust Federated Covariance Learning Against Noisy Labels

Das Paper stellt FedCova vor, ein robustes Framework für das federierte Lernen, das durch die Nutzung von Feature-Kovarianzen und gegenseitiger Informationsmaximierung ohne externe Referenzdaten effektiv gegen verrauschte Labels in heterogenen Umgebungen vorgeht.

Xiangyu Zhong, Xiaojun Yuan, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Tuning Just Enough: Lightweight Backdoor Attacks on Multi-Encoder Diffusion Models

Diese Arbeit stellt MELT vor, einen effizienten Backdoor-Angriff auf Multi-Encoder-Diffusionsmodelle wie Stable Diffusion 3, der durch das gezielte Fine-Tuning weniger als 0,2 % der Encoder-Parameter mittels Low-Rank-Adaptern erfolgreich Angriffe ermöglicht, ohne die vortrainierten Gewichte zu verändern.

Ziyuan Chen, Yujin Jeong, Tobias Braun + 1 more2026-03-05🤖 cs.LG

Reducing hyperparameter sensitivity in measurement-feedback based Ising machines

Die Autoren analysieren die Diskrepanz zwischen zeitkontinuierlichen Modellen und zeitdiskreten Mess-Rückkopplungs-Architekturen bei Ising-Maschinen, die zu einer erhöhten Hyperparameter-Empfindlichkeit führt, und stellen eine experimentell validierte Methode vor, um diese Empfindlichkeit zu verringern.

Toon Sevenants, Guy Van der Sande, Guy Verschaffelt2026-03-05🔬 physics.app-ph

When to restart? Exploring escalating restarts on convergence

Der Artikel stellt SGD-ER vor, eine adaptive Lernratenstrategie, die bei Stagnation Neustarts mit eskalierenden Lernraten auslöst, um flachere Minima zu finden und die Genauigkeit auf verschiedenen Datensätzen und Architekturen signifikant zu verbessern.

Ayush K. Varshney, Šarūnas Girdzijauskas, Konstantinos Vandikas + 1 more2026-03-05🤖 cs.LG

FastWave: Optimized Diffusion Model for Audio Super-Resolution

Das Paper stellt FastWave vor, einen optimierten Diffusionsmodell-Ansatz für die Audio-Super-Resolution, der durch seine geringe Parameterzahl und Rechenkomplexität eine schnellere und ressourcenschonendere Alternative zu bestehenden Methoden bietet und dabei mit dem State-of-the-Art mithalten kann.

Nikita Kuznetsov, Maksim Kaledin2026-03-05🤖 cs.LG

BeamPERL: Parameter-Efficient RL with Verifiable Rewards Specializes Compact LLMs for Structured Beam Mechanics Reasoning

Die Studie zeigt, dass reinforcement learning mit exakten physikalischen Belohnungen zwar die Leistung kompakter Sprachmodelle bei Balkenstatik verbessert, jedoch oft zu oberflächlichem Musterabgleich anstelle eines robusten, generalisierbaren physikalischen Verständnisses führt, was den Bedarf an strukturierten Denkgerüsten unterstreicht.

Tarjei Paule Hage, Markus J. Buehler2026-03-05🔬 cond-mat.mtrl-sci

Data-Aware Random Feature Kernel for Transformers

Die Arbeit stellt DARKFormer vor, einen Transformer, der durch eine datenbewusste Kernel-Geometrie und einen effizienten, varianzreduzierten Importance-Sampling-Schätzer die quadratische Komplexität von Attention auf lineare reduziert und dabei die Leistungslücke zu exakten Softmax-Modellen insbesondere bei anisotropen, vortrainierten Repräsentationen schließt.

Amirhossein Farzam, Hossein Mobahi, Nolan Andrew Miller + 1 more2026-03-05🤖 cs.AI

Two-Stage Photovoltaic Forecasting: Separating Weather Prediction from Plant-Characteristics

Die vorgestellte Studie zerlegt die Photovoltaik-Prognose in ein Wettervorhersagemodell und ein anlagenspezifisches Modell, um durch die getrennte Analyse von Umweltdaten und Standortfaktoren sowie die Untersuchung der Fehlerverteilung genauere Ergebnisse für stochastische Optimierungen zu erzielen.

Philipp Danner, Hermann de Meer2026-03-05🤖 cs.LG

Exploiting Subgradient Sparsity in Max-Plus Neural Networks

Diese Arbeit stellt einen sparsen Subgradienten-Algorithmus vor, der die durch die Max-Plus-Algebra bedingte Sparsity in den Gradienten gezielt ausnutzt, um das Training von Max-Plus-Neuronalen Netzen effizienter zu gestalten.

Ikhlas Enaieh, Olivier Fercoq2026-03-05🤖 cs.LG

InstMeter: An Instruction-Level Method to Predict Energy and Latency of DL Model Inference on MCUs

Die Arbeit stellt InstMeter vor, eine präzise und dateneffiziente Methode zur Vorhersage von Energieverbrauch und Latenz bei der Inferenz von Deep-Learning-Modellen auf Mikrocontrollern auf Basis von Taktzyklen, die im Vergleich zu bestehenden Ansätzen deutlich geringere Fehler aufweist und die Suche nach optimalen Modellen im Rahmen des Neural Architecture Search (NAS) verbessert.

Hao Liu, Qing Wang, Marco Zuniga2026-03-05🤖 cs.LG

Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization

Die Arbeit stellt DPPO vor, ein Framework, das durch importance-sampling-basierte Korrektur und dichte Prompt-Packing-Strategien das rechenintensive GRPO beschleunigt, ohne dabei die theoretische Unverzerrtheit der Gradientenschätzung zu beeinträchtigen.

Haodong Zhu, Yangyang Ren, Yanjing Li + 6 more2026-03-05🤖 cs.AI

← Zurück Weiter →