cs.LG Arbeiten | Gist.Science

How to make the most of your masked language model for protein engineering

Die Autoren stellen eine flexible Stichprobenmethode mit stochastischer Beam-Suche für Masked Language Models vor, die durch systematische in silico- und in vitro-Evaluierungen im Bereich der Antikörper-Engineering zeigt, dass die Wahl der Sampling-Methode mindestens genauso entscheidend für den Erfolg ist wie die Wahl des Modells selbst.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Die vorgestellte Arbeit führt datengesteuerte Integrationskerne ein, die das Lernen nichtlokaler Operatoren durch die Trennung der nichtlokalen Informationsaggregation von der lokalen nichtlinearen Vorhersage strukturieren, wodurch die Interpretierbarkeit erhöht und die Anzahl der trainierbaren Parameter bei gleichbleibender Vorhersagegüte für den südasiatischen Monsun drastisch reduziert wird.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

Das Paper stellt NasoVoce vor, eine unauffällige, an der Nasenbrücke montierte Schnittstelle, die durch die Fusion von Mikrofon- und Vibrationssensordaten eine robuste und diskrete Spracherkennung für leise und geflüsterte Sprache in lauten Umgebungen ermöglicht.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

Das Paper stellt FairFAL vor, ein adaptives Framework für das federierte aktive Lernen, das durch die Analyse von Modellunterschieden und eine prototypengestützte Abfragestrategie die Effektivität unter extremen nicht-IID-Bedingungen und globaler Klassenungleichgewicht signifikant verbessert.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Die Arbeit untersucht das Problem der Identifizierung des besten Arms in nicht-stationären linearen Banditen mit festem Budget, indem sie eine arm-mengenabhängige untere Schranke für die Fehlerwahrscheinlichkeit herleitet und den zugehörigen $\textsf{Adjacent-BAI}$ -Algorithmus vorschlägt, der diese Schranke bis auf Konstanten erreicht.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

Das Papier stellt HEAL vor, ein RL-freies Framework zur Wissensdistillation von großen zu kleineren Reasoning-Modellen, das durch die Kombination aus entropiegestützter Fehlerkorrektur, Unsicherheitsfilterung und einem progressiven Lehrplan die Grenzen traditioneller Rejektions-Sampling-Methoden überwindet.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Die Arbeit stellt Causal Concept Graphs (CCG) vor, eine Methode, die sparse Autoencoder mit differentiablem Struktur-Lernen kombiniert, um kausale Abhängigkeiten zwischen Konzepten im latenten Raum von Sprachmodellen zu identifizieren und nachzuweisen, dass graphenbasierte Interventionen die reasoning-Fähigkeiten signifikant effektiver verbessern als bestehende Ansätze.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Diese Arbeit leitet ein skalierbares Gesetz her, das die optimale Aufteilung der Rechenleistung zwischen Experten- und Aufmerksamkeits-Schichten in Mixture-of-Experts-Modellen bestimmt, um die Leistung bei festem Budget zu maximieren und die Chinchilla-Skalierungsgesetze zu erweitern.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Diese Arbeit stellt eine varianzbewusste adaptive Gewichtungsmethode vor, die das Ungleichgewicht im Trainingsprozess von Diffusionsmodellen über verschiedene Rauschpegel hinweg ausgleicht und dadurch auf CIFAR-Datensätzen eine stabilere Optimierung sowie eine verbesserte generative Leistung erzielt.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

Graph-GRPO: Training Graph Flow Models with Reinforcement Learning

Die Arbeit stellt Graph-GRPO vor, ein Online-Reinforcement-Learning-Framework für Graph-Flow-Modelle, das durch eine analytische Übergangswahrscheinlichkeit und eine lokale Verfeinerungsstrategie eine effiziente Ausrichtung auf komplexe Ziele ermöglicht und dabei state-of-the-art-Ergebnisse in der molekularen Optimierung erzielt.

Baoheng Zhu, Deyu Bo, Delvin Ce Zhang, Xiao Wang2026-03-12🤖 cs.LG

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Diese Arbeit analysiert die Lern dynamik von zweischichtigen linearen Netzwerken unter label-noise SGD und zeigt, dass das Rauschen einen kritischen Übergang vom „lazy" zum „rich" Regime bewirkt, was die verbesserte Generalisierung erklärt und auf Sharpness-Aware Minimization (SAM) verallgemeinert werden kann.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Die Arbeit stellt den PP-LUCB-Algorithmus vor, der durch die Kombination von verzerrten LLM-Bewertungen mit kostengünstigen, selektiven menschlichen Audits und einer speziellen Schätzmethode die effiziente Identifizierung optimaler Servicekonfigurationen ermöglicht und dabei die Auditkosten um 90 % senkt.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Die Arbeit stellt STemDist vor, die erste Dataset-Distillationsmethode für die spatio-temporale Vorhersage, die durch eine ausgewogene zweidimensionale Kompression von Raum und Zeit sowie eine Cluster-basierte Verfeinerung die Trainingszeit und den Speicherbedarf signifikant reduziert und gleichzeitig die Vorhersagegenauigkeit verbessert.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Diese Arbeit stellt einen domänenadaptiven Rahmen vor, der durch abbaustufen-synchronisierte Stichprobenziehung und einen cross-domänen ausgerichteten großen Autoencoder mit großen Kerneln und Cross-Attention-Mechanismen die Erstellung robuster Gesundheitsindikatoren für die Prognose und das Gesundheitsmanagement unter variierenden Betriebsbedingungen verbessert.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Die Arbeit stellt Weighted improved Greedy Sampling (WiGS) vor, eine Methode, die das statische Multiplikationsprinzip des Improved Greedy Sampling durch ein dynamisches, auf Reinforcement Learning basierendes additives Kriterium ersetzt, um die Balance zwischen Exploration und Investigation anzupassen und so die Genauigkeit sowie die Effizienz bei der Kennzeichnung von Daten in Regressionen zu verbessern.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick2026-03-12📊 stat

GGMPs: Generalized Gaussian Mixture Processes

Die Arbeit stellt den Generalized Gaussian Mixture Process (GGMP) vor, einen skalierbaren, auf Gauß-Prozessen basierenden Ansatz zur effizienten Schätzung multimodaler bedingter Dichten, der die Beschränkungen standardmäßiger unimodaler Gauß-Prozesse überwindet.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. Noack2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Die Arbeit zeigt, dass das Entfernen einer kohärenten Rang-eins-Mittelwertverzerrung die numerische Instabilität bei der FP4-Quantisierung von LLMs effektiv behebt und so eine hardwareeffiziente, stabile Ausbildung ermöglicht, die das Leistungsniveau von BF16 nahezu erreicht.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models

Die vorgestellte Arbeit führt eine effektive, promptfreie Methode zum selektiven Vergessen spezifischer, nicht textuell beschreibbarer Instanzen (wie Gesichter oder kulturelle Fehldarstellungen) in Diffusionsmodellen ein, indem sie Bildbearbeitung, taktaware Gewichtung und Gradient-Chirurgie kombiniert, um Datenschutz und ethische Compliance zu gewährleisten.

Kyungryeol Lee, Kyeonghyun Lee, Seongmin Hong, Byung Hyun Lee, Se Young Chun2026-03-12🤖 cs.LG

Brenier Isotonic Regression

Der Artikel stellt die „Brenier-Isotone Regression" vor, eine Erweiterung der klassischen isotonen Regression auf multivariate Ausgaben durch die Nutzung zyklischer Monotonie und optimaler Transporttheorie, die sich in Anwendungen wie der Wahrscheinlichkeitskalibrierung als überlegen erweist.

Han Bao, Amirreza Eshraghi, Yutong Wang2026-03-12📊 stat

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

Diese Studie stellt einen Multi-Resolution-ConvLSTM-Ensemble-Ansatz vor, der durch die Kombination verschiedener zeitlicher Eingabeauflösungen die Fehlerakkumulation bei der langfristigen Vorhersage von Verformungen von Stützwänden während der Baugrubenaushubarbeiten effektiv reduziert und die Vorhersagegenauigkeit verbessert.

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG

← Zurück Weiter →