Continual Unlearning for Text-to-Image Diffusion Models: A Regularization Perspective

Diese Studie führt die erste systematische Untersuchung des kontinuierlichen Vergessens bei Text-zu-Bild-Diffusionsmodellen durch, identifiziert kumulative Parameterdrift als Hauptursache für den Leistungsabfall und schlägt Regularisierungsmethoden vor, die das Vergessen spezifischer Konzepte ermöglichen, ohne das allgemeine Modellwissen zu beeinträchtigen.

Justin Lee, Zheda Mai, Jinsu Yoo + 3 more2026-03-04🤖 cs.LG

QiMeng-CRUX: Narrowing the Gap Between Natural Language and Verilog via Core Refined Understanding eXpression for Circuit Design

Die Arbeit stellt QiMeng-CRUX vor, ein Framework, das mithilfe einer strukturierten Zwischensprache (CRUX) und eines zweistufigen Trainingsverfahrens die Lücke zwischen mehrdeutigen natürlichen Sprachbeschreibungen und präziser Verilog-Codegenerierung schließt und dabei state-of-the-art Ergebnisse erzielt.

Lei Huang, Rui Zhang, Jiaming Guo + 9 more2026-03-04🤖 cs.LG

Automated Data Enrichment using Confidence-Aware Fine-Grained Debate among Open-Source LLMs for Mental Health and Online Safety

Diese Arbeit stellt ein konfidenzbewusstes, feinabgestuftes Debatten-Framework (CFD) vor, das Open-Source-LLMs zur automatischen Anreicherung von Trainingsdaten für die mentale Gesundheit und Online-Sicherheit nutzt und dabei durch die Verwendung von Debattentranskripten signifikante Verbesserungen bei nachgelagerten Aufgaben erzielt.

Junyu Mao, Anthony Hills, Talia Tseriotou + 10 more2026-03-04💬 cs.CL

A Neural Network-Based Real-time Casing Collar Recognition System for Downhole Instruments

Die vorgestellte Arbeit stellt Collar Recognition Nets (CRNs), eine Familie von leichtgewichtigen, 1-D-Convolutional-Neural-Networks vor, die es ermöglichen, Kesselmanschetten in Echtzeit unter strengen Ressourcenbeschränkungen in Downhole-Umgebungen präzise zu erkennen und damit autonome Tiefenkontrollen für Bohrlochinstrumente zu realisieren.

Si-Yu Xiao, Xin-Di Zhao, Xiang-Zhan Wang + 8 more2026-03-04⚡ eess

Multi-Scenario Highway Lane-Change Intention Prediction: A Temporal Physics-Informed Multi-Modal Framework

Die Studie stellt TPI-AI vor, einen hybriden Rahmen aus tiefen temporalen Repräsentationen und physikbasierten Interaktionsmerkmalen, der durch einen LightGBM-Klassifikator robuste Vorhersagen von Fahrspurwechselabsichten über verschiedene Autobahnszenarien hinweg ermöglicht und dabei die Herausforderungen von Klassenungleichgewicht und Rauschen in den Daten adressiert.

Jiazhao Shi, Ziyu Wang, Yichen Lin + 1 more2026-03-04🤖 cs.LG

Distributional value gradients for stochastic environments

Diese Arbeit stellt „Distributional Sobolev Training" vor, eine Methode, die durch die Modellierung der Verteilung von Wertfunktionen und deren Gradienten mittels eines bedingten VAE und des Max-Sliced Maximum Mean Discrepancy-Abstands die Effizienz von Gradientenregularisierung in stochastischen Umgebungen verbessert und dabei die Kontraktionseigenschaften des erweiterten Bellman-Operators theoretisch untermauert.

Baptiste Debes, Tinne Tuytelaars2026-03-04🤖 cs.LG

Quantization-Aware Distillation for NVFP4 Inference Accuracy Recovery

Dieser technische Bericht stellt die Quantisierungsbewusste Destillation (QAD) als eine robuste und stabile Methode vor, um die Genauigkeit von in NVFP4 quantisierten großen Sprach- und Vision-Sprachmodellen wiederherzustellen, indem ein vollpräzises Lehrermodell in ein quantisiertes Schülermodell destilliert wird, was insbesondere bei komplexen Nachtrainingspipelines Vorteile gegenüber herkömmlichen Ansätzen bietet.

Meng Xin, Sweta Priyadarshi, Jingyu Xin + 26 more2026-03-04🤖 cs.LG