Von Autoren geprüfte Arbeiten

Bei jeder Arbeit auf dieser Seite hat mindestens ein/e der ursprünglichen Autor*innen unsere verständliche Erklärung gesehen und begutachtet — entweder durch Bestätigung der Genauigkeit oder durch Korrekturwünsche, die wir anschließend umgesetzt haben. Eine Bestätigung bedeutet keine formelle Freigabe jedes Satzes, aber die Erklärung ist von den Menschen geprüft worden, die das Paper geschrieben haben.

607 von Autoren geprüfte Arbeiten · 351–360 / 607

Key-Value Means

Der Artikel stellt Key-Value Means (KVM) vor, einen neuartigen Block-Rekurrenzmechanismus für die Aufmerksamkeit, der die Vorteile von Transformern und linearen RNNs vereint, indem er ein effizientes, chunk-paralleles Training mit flexibler Zustandsvergrößerung und subquadratischer Vorfüllzeit ermöglicht, und zwar allesamt unter Verwendung standardmäßiger Operationen und minimaler zusätzlicher Parameter.

Daniel Goldstein, Eugene Cheah2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models

Das Papier stellt DP-LAC vor, eine leichte Methode für differenziell privates federiertes Feinabstimmen von Sprachmodellen, die den Clipping-Schwellenwert effizient schätzt und anpasst, ohne zusätzliche Privatsphärenkosten oder Hyperparameter-Optimierung, und eine Genauigkeitsverbesserung von 6,6 % gegenüber bestehenden Ansätzen erzielt.

Haaris Mehmood, Jie Xu, Karthikeyan Saravanan, Rogier Van Dalen, Mete Ozay2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Test-Time Speculation

Dieser Beitrag stellt Test-Time Speculation (TTS) vor, eine Online-Distillationsmethode, die ein Entwurfsmodell während der Inferenz kontinuierlich anhand der Verifikationssignale des Zielmodells anpasst, wodurch die Leistungsverschlechterung bestehender Spekulatoren bei langen Sequenzen überwunden und die Akzeptanzlängen erheblich verbessert werden.

Avinash Kumar, Sujay Sanghavi, Poulami Das2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Building Korean linguistic resource for NLU data generation of banking app CS dialog system

Dieser Beitrag stellt die Erstellung des Financial Annotated Dataset (FIAD) vor, einer koreanischen linguistischen Ressource, die aus Bewertungen von Banking-Apps und lokalen Grammatikgraphen abgeleitet wird und zur Generierung annotierter Trainingsdaten dient, die die Leistung verschiedener NLU-Modelle in Dialogsystemen für den Bankkundenservice erheblich verbessern.

Jeongwoo Yoon, On-yu Park, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, Jeesun Nam2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

NEO: No-Optimization Test-Time Adaptation through Latent Re-Centering

NEO ist eine hyperparameterfreie, rechnerisch effiziente Test-Time-Adaptions-Methode, die die Robustheit und Kalibrierung von Modellen unter Verteilungsverschiebungen verbessert, indem sie die Einbettungen der Ziel-Daten am Ursprung neu zentriert, und dabei auf mehreren Datensätzen und Geräten mit minimalem Rechenaufwand überlegene Genauigkeit erzielt.

Alexander Murphy, Michal Danilowski, Soumyajit Chatterjee, Abhirup Ghosh2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Scam2Prompt: A Scalable Framework for Auditing Malicious Scam Endpoints in Production LLMs

Die Arbeit stellt Scam2Prompt vor, ein skalierbares Framework, das eine kritische und sich verschärfende Sicherheitslücke in produktiven Large Language Models aufzeigt, bei der automatisierte Prompts, die von betrügerischen Phishing-Websites abgeleitet sind, in bis zu 47,3 % der Fälle über mehrere Modelle hinweg erfolgreich die Generierung schädlichen Codes auslösen und damit aktuelle Sicherheitsmaßnahmen wie Guardrails und RAG als unzureichend erweisen.

Zhiyang Chen, Tara Saba, Xun Deng, Xujie Si, Fan Long2026-05-12✓ Author reviewed ⓘ🤖 cs.AI

Distributional Learning of Context-Free Languages under Fixed Finite-Monoid Typing

Dieser Beitrag zeigt, dass kontextfreie Sprachen, die unter einer festen Typisierung durch endliche Monoide substituierbar sind, aus positiven Daten im Limes identifizierbar sind, wobei die Konstruktion und Aktualisierung der Hypothesen für die allgemeine Klasse mit festem h polynomiell in der Stichprobengröße laufen, während für die lineare Unterklasse eine vollständige polynomielle Zeit- und Daten-Garantie (einschließlich einer polynomiellen Schranke für die charakteristische Stichprobengröße) gilt, indem eine endliche Typ-Rekonstruktions-Theorie entwickelt wird, die eine kanonische Hypothesengrammatik nutzt, die aus einer endlichen Beobachtungsmenge abgeleitet wird.

Takayuki Kuriyama2026-05-12✓ Author reviewed ⓘ💻 cs

Entropy of pebble automata and space complexity

Das Papier beweist, dass die Komplexitätsklasse NL von logCFL verschieden ist, ein Ergebnis, das weiterhin die Trennungen L ≠ Ptime und NL ≠ Ptime impliziert.

J. Andres Montoya2026-05-12✓ Author reviewed ⓘ💻 cs

Latent-Space Causal Discovery from Indirect Neuroimaging Observations

Dieser Artikel stellt INCAMA vor, ein physikbewusstes Framework, das die Inversion im latenten Raum mit einem verzögerungsbewussten Mamba-Encoder kombiniert, um gerichtete neuronale kausale Strukturen aus verzerrten neuroimaging-Signalen wiederherzustellen, und zeigt in Simulationen sowie realen fMRI-Daten eine überlegene Leistung gegenüber Baselines.

Sangyoon Bae, Miruna Oprescu, David Keetae Park, Shinjae Yoo, Jiook Cha2026-05-11✓ Author reviewed ⓘ🧬 q-bio

A Quadratic-Form Representation of the Scalar Casimir Trace from Codimension-Three Riesz Reduction

Diese Arbeit stellt eine quadratische Formdarstellung der skalaren Casimir-Spur her, indem sie einen induzierten Greenschen Kern aus einer Riesz-Reduktion der Kodimension drei ableitet, was es ermöglicht, dass der Erwartungswert der Energie einer wärmeregularisierten Gaußschen Quelle die Spur exakt reproduziert und die Standardergebnisse für den endlichen Teil in Dirichlet-Parallelplatten-Geometrien bestätigt.

Irshadullah Khan, Bilal Khan2026-05-11✓ Author reviewed ⓘ🔢 math

← Zurück Weiter →