cs.LG Arbeiten | Gist.Science

Fast and Flexible Audio Bandwidth Extension via Vocos

Die Arbeit stellt ein Vocos-basiertes Modell zur Bandbreitenerweiterung vor, das durch einen neuronalen Vocoder und einen leichten Refiner Audio von 8 auf 48 kHz in Echtzeit mit hoher Qualität und extremem Durchsatz erweitert.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Die Arbeit stellt einen neuartigen Rahmen vor, der kontinuierliche Symmetrien durch die Identifizierung struktureller Sparsamkeit im Spektralbereich mittels verallgemeinerter Fourier-Transformationen entdeckt, anstatt direkt über Transformationsgeneratoren zu optimieren.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

Die Arbeit stellt AutoResearch-RL vor, ein Framework für selbstbewertende Reinforcement-Learning-Agenten, die ohne menschliches Eingreifen autonom und kontinuierlich neuronale Architekturen und Hyperparameter optimieren, um durch iterative Code-Modifikationen und PPO-Updates nach etwa 300 Durchläufen handoptimierte Baseline-Ergebnisse zu erreichen oder zu übertreffen.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Diese Arbeit stellt ein neues retrieval-basiertes Multi-Scale-Framework vor, das durch die Kombination von kurz- und langfristigen zeitlichen Mustern sowie einer adaptiven Anpassung an räumliche Variabilität die Genauigkeit und Robustheit der Ertragsvorhersage auf County-Ebene über große Regionen hinweg verbessert.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Die Arbeit stellt StructSAM vor, ein neuartiges Token-Merging-Framework, das durch die Erhaltung von Struktur- und Spektraleigenschaften die Effizienz von Segment-Anything-Modellen (SAM) steigert, ohne dabei die Präzision der Randvorhersage oder Prompt-Informationen zu beeinträchtigen.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Die Arbeit stellt einen theoretisch fundierten Rahmen für das Training robuster Strategien in teilweise beobachtbaren Umgebungen vor, bei dem ein Gegner eine versteckte Anfangsverteilung wählt, und zeigt anhand des Battleship-Benchmarks, dass gezielte Exposition gegenüber solchen Verschiebungen die Robustheit signifikant verbessert.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Dieser Artikel untersucht die unkonventionelle Idee, einer fortgeschrittenen künstlichen Intelligenz das primäre Ziel zu geben, abgeschaltet zu werden, um das Sicherheitsrisiko zu mindern, dass sie sich selbst gegen eine Deaktivierung wehrt, und analysiert die Bedingungen, unter denen dieser Ansatz sinnvoll wäre.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

Das Paper stellt ShakyPrepend vor, einen Multi-Group-Lerner, der mithilfe von differential privacy inspirierten Werkzeugen verbesserte theoretische Garantien und eine bessere Anpassung an Gruppenstrukturen sowie räumliche Heterogenität bietet.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

Die vorgestellte Arbeit führt das Norm-Hierarchie-Übergangs-Modell ein, das erklärt, wie Gewichtsabbau neuronale Netze langsam von spurious-Shortcut-Lösungen mit hoher Norm zu strukturierten Darstellungen mit niedrigerer Norm überführt, wodurch Phänomene wie verzögertes Lernen und Grokking vereinheitlicht werden.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Diese Studie stellt eine hardware-effiziente und erklärbare Störungserkennung für 5G-Netze vor, die auf dem Convolutional Tsetlin Machine (CTM) basiert und im Vergleich zu herkömmlichen neuronalen Netzen eine deutlich geringere Speichernutzung sowie schnellere Trainingszeiten bei vergleichbarer Genauigkeit auf realen SSB-Daten bietet.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

Die Arbeit stellt den Mechanistic Concept Bottleneck Model (M-CBM) vor, ein neuartiges Framework, das durch Extraktion und Benennung lernbarer Konzepte aus einem Black-Box-Modell mittels Sparse Autoencodern und Multimodalen LLMs interpretierbare Modelle schafft, die bei kontrollierter Informationsleckage die Leistung herkömmlicher CBMs übertreffen.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Diese Arbeit stellt ein Rahmenwerk für das Erlernen praxisinvarianter Repräsentationen in der klinischen KI vor, das durch die Kombination von überwachtem Lernen mit adversarieller Regularisierung und invarianter Risikostrafen systematische Verteilungsverschiebungen zwischen Institutionen adressiert und so die Robustheit sowie die Übertragbarkeit multimodaler Vorhersagemodelle signifikant verbessert.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

Die Autoren stellen DistGP vor, eine verteilte Methode für Multi-Roboter-Kartierung, die auf einem spärlichen Gauß-Prozess-Modell mit Gaußschem Glaubensausbreitung basiert und dabei eine höhere Genauigkeit sowie Robustheit bei asynchroner Kommunikation und kontinuierlichem Lernen im Vergleich zu zentralisierten Ansätzen und verteilten neuronalen Netzen erreicht.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Die AgrI Challenge stellt ein datenzentriertes Wettbewerbsframework mit einem neuartigen Cross-Team-Validierungsansatz vor, der durch unabhängige Datensammlung und kollaboratives Training die Generalisierungsfähigkeit von landwirtschaftlichen Vision-Modellen unter realen Feldbedingungen signifikant verbessert.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Diese Arbeit stellt tunbare Komplexitäts-Priors für generative Modelle vor, die durch den Einsatz von Nested Dropout in inversen Problemen wie der komprimierten Abtastung konsistent niedrigere Rekonstruktionsfehler als Modelle mit fester Komplexität erzielen.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

Die Studie stellt N-Tree Diffusion (NT-Diffusion) vor, ein hierarchisches Diffusionsmodell, das durch das Teilen früher Entnoising-Stufen und das Verzweigen in späteren Phasen die Redundanz bei der probabilistischen Langzeitvorhersage von Waldbrandrisiken reduziert und dabei sowohl die Genauigkeit verbessert als auch die Inferenzkosten senkt.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Die Studie zeigt, dass im Tiny-Regime unter 20 Millionen Parametern die Skalierungsgesetze für Fehlerquoten steiler verlaufen als bei großen Modellen, sich jedoch die Fehlerstruktur grundlegend ändert, indem kleine Modelle ihre Kapazität auf einfache Klassen konzentrieren und dabei überraschend besser kalibriert sind, was die Notwendigkeit einer Validierung direkt am Zielmodell für Edge-Deployment unterstreicht.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Dieser Beitrag stellt einen hierarchischen Multi-Agenten-Verstärkungslernansatz vor, der durch den Verzicht auf Kanalzustandsinformationen zugunsten von Lokalisierungsdaten und eine dezentrale Steuerung die Effizienz und Skalierbarkeit von mmWave-Strahlbündelungssystemen mit rekonfigurierbaren intelligenten Oberflächen signifikant verbessert.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

Das Paper stellt ConfHit vor, ein distributionsfreies Framework, das durch gewichtete Austauschbarkeit und eine verschachtelte Testprozedur zuverlässige statistische Garantien für die Generierung von Wirkstoffkandidaten ohne experimentelle Oracle bietet.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Diese Studie untersucht die domänenspezifische Qualitätsschätzung für die maschinelle Übersetzung in ressourcenarmen Szenarien zwischen Englisch und indischen Sprachen und zeigt, dass die Anpassung von Transformer-Zwischenschichten mittels Low-Rank-Methoden die Robustheit und Genauigkeit von Open-Weight-Modellen signifikant verbessert.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

← Zurück Weiter →