cs.LG Arbeiten | Gist.Science

BornoViT: A Novel Efficient Vision Transformer for Bengali Handwritten Basic Characters Classification

Die Studie stellt BornoViT vor, einen neuartigen, ressourcenschonenden Vision-Transformer mit nur 0,65 Millionen Parametern, der für die Klassifizierung bengalischer handschriftlicher Zeichen und Ziffern entwickelt wurde und auf dem BanglaLekha-Datensatz eine Genauigkeit von 95,77 % erreicht.

Rafi Hassan Chowdhury, Naimul Haque, Kaniz Fatiha2026-03-04🤖 cs.LG

Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic

Diese Arbeit stellt einen theoretischen Rahmen vor, der Group Relative Policy Optimization (GRPO) als U-Statistik charakterisiert, um dessen asymptotische Optimalität, Fehlergrenzen und eine universelle Skalierungsregel für die Gruppengröße herzuleiten und empirisch zu validieren.

Hongyi Zhou, Kai Ye, Erhan Xu + 4 more2026-03-04📊 stat

Grokking as a Phase Transition between Competing Basins: a Singular Learning Theory Approach

Diese Arbeit interpretiert das Phänomen des „Grokking" als Phasenübergang zwischen konkurrierenden Lösungsbecken mittels der Singular Learning Theory, wobei sie geschlossene Ausdrücke für den lokalen Lernkoeffizienten in quadratischen Netzwerken herleitet und empirisch nachweist, dass dieser Koeffizient ein zuverlässiges Werkzeug zur Verfolgung der Generalisierungsdynamik darstellt.

Ben Cullen, Sergio Estan-Ruiz, Riya Danait + 1 more2026-03-04📊 stat

Operator Learning Using Weak Supervision from Walk-on-Spheres

Die Arbeit stellt die Walk-on-Spheres Neural Operator (WoS-NO) vor, eine Methode, die mithilfe der Walk-on-Spheres-Methode schwache Supervision aus Monte-Carlo-Simulationen nutzt, um neuronale Operatoren für partielle Differentialgleichungen effizient und datenfrei zu trainieren, wodurch höhere Ableitungen vermieden werden und eine überlegene Genauigkeit, Geschwindigkeit sowie Speicherersparnis im Vergleich zu herkömmlichen physik-informierten Ansätzen erreicht wird.

Hrishikesh Viswanath, Hong Chul Nam, Xi Deng + 3 more2026-03-04🤖 cs.LG

What Helps---and What Hurts: Bidirectional Explanations for Vision Transformers

Die Arbeit stellt BiCAM vor, eine bidirektionale Methode zur Erzeugung von Klassifikationsaktivierungskarten für Vision Transformer, die sowohl positive als auch negative Beiträge berücksichtigt, um interpretierbare Erklärungen zu verbessern und Adversarial Examples effizient zu erkennen.

Qin Su, Tie Luo2026-03-04🤖 cs.AI

Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning

Diese Arbeit stellt die Coupled Policy Optimization vor, eine Methode, die durch KL-basierte Regularisierung die Inter-Policy-Diversität in Ensemble-Policy-Gradient-Algorithmen steuert, um stabile und effiziente Exploration in großskaligen Reinforcement-Learning-Szenarien zu ermöglichen und dabei bestehende Baselines wie SAPG, PBT und PPO zu übertreffen.

Naoki Shitanda, Motoki Omura, Tatsuya Harada + 1 more2026-03-04🤖 cs.AI

Hyperparameter Trajectory Inference with Conditional Lagrangian Optimal Transport

Dieses Paper stellt eine Methode zur Hyperparameter-Trajektorien-Inferenz vor, die mittels bedingtem Lagrange-optimalen Transport ein Surrogatmodell entwickelt, um das Verhalten neuronaler Netze bei veränderten Hyperparametern effizient vorherzusagen und teures Nachtrainieren zu vermeiden.

Harry Amad, Mihaela van der Schaar2026-03-04🤖 cs.AI

RxnNano:Training Compact LLMs for Chemical Reaction and Retrosynthesis Prediction via Hierarchical Curriculum Learning

Das Paper stellt RxnNano vor, ein kompaktes 0,5-Milliarden-Parameter-LLM, das durch hierarchisches Curriculum-Lernen und innovative chemische Konsistenzmechanismen deutlich bessere Vorhersagen für chemische Reaktionen und Retrosynthese erzielt als deutlich größere Modelle.

Ran Li, Shimin Di, Haowei LI + 4 more2026-03-04🤖 cs.AI

ATPO: Adaptive Tree Policy Optimization for Multi-Turn Medical Dialogue

Die vorgestellte Arbeit führt den adaptiven Baum-Policy-Optimierungsalgorithmus (ATPO) ein, der durch unsicherheitsgesteuerte Rollout-Allokation und effiziente Suchtechniken Large Language Models für mehrstufige medizinische Dialoge optimiert und dabei selbst kleinere Modelle wie Qwen3-8B in der Genauigkeit deutlich über größere Baseline-Modelle wie GPT-4o hebt.

Ruike Cao, Shaojie Bai, Fugen Yao + 3 more2026-03-04🤖 cs.AI

Is Retraining-Free Enough? The Necessity of Router Calibration for Efficient MoE Compression

Die Arbeit zeigt, dass eine retraining-freie Kompression von MoE-Modellen durch eine leichte Kalibrierung des Routers mittels Wissensdistillation (Router KD) signifikant verbessert werden kann, um die durch Router-Experten-Mismatch verursachten Leistungsverluste zu beheben.

Sieun Hyeon, Jaeyoung Do2026-03-04🤖 cs.AI

Self-Play Only Evolves When Self-Synthetic Pipeline Ensures Learnable Information Gain

Die Studie zeigt, dass eine nachhaltige Selbstentwicklung von Sprachmodellen nur durch einen selbstsynthetischen Datenpipeline mit messbarem Informationsgewinn gelingt, der durch asymmetrische Ko-Evolution, Kapazitätswachstum und proaktive Informationssuche erreicht wird.

Wei Liu, Siya Qi, Yali Du + 1 more2026-03-04💬 cs.CL

NExT-Guard: Training-Free Streaming Safeguard without Token-Level Labels

Die Arbeit stellt NExT-Guard vor, ein trainingsfreies Framework, das durch die Überwachung interpretierbarer latenter Merkmale aus Sparse Autoencodern Echtzeit-Sicherheitsgarantien für Streaming-Sprachmodelle ermöglicht und dabei teure Token-Level-Annotationen überflüssig macht.

Junfeng Fang, Nachuan Chen, Houcheng Jiang + 5 more2026-03-04🤖 cs.AI

Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting

Die Arbeit stellt TimeGS vor, ein neuartiges Framework, das die Zeitreihenvorhersage durch eine Umdeutung als 2D-Rendering mit adaptiven Gauß-Kernen und chronologisch kontinuierlicher Rasterisierung revolutioniert, um die Grenzen bestehender 2D-Reshaping-Ansätze zu überwinden und state-of-the-art Ergebnisse zu erzielen.

Yixin Wang, Yifan Hu, Peiyuan Liu + 3 more2026-03-04🤖 cs.AI

MedFeat: Model-Aware and Explainability-Driven Feature Engineering with LLMs for Clinical Tabular Prediction

MedFeat ist ein von LLMs gestützter, modellbewusster Framework für das Feature-Engineering im klinischen Bereich, der durch SHAP-basierte Erklärungen und Feedback-Schleifen stabile Vorhersageverbesserungen sowie generalisierbare, klinisch relevante Merkmale über verschiedene Datensätze hinweg erzielt.

Zizheng Zhang, Yiming Li, Justin Xu + 6 more2026-03-04🤖 cs.AI

MedCalc-Bench Doesn't Measure What You Think: A Benchmark Audit and the Case for Open-Book Evaluation

Die Studie zeigt durch eine systematische Fehlerbereinigung und den Einsatz von „Open-Book"-Prompting, dass MedCalc-Bench primär Formelwissen und Rechengenauigkeit statt klinischer Reasoning-Fähigkeiten misst und daher als Tool-Use-Evaluierung neu zu bewerten ist.

Artus Krohn-Grimberghe2026-03-04🤖 cs.AI

Characterizing and Predicting Wildfire Evacuation Behavior: A Dual-Stage ML Approach

Diese Studie nutzt einen dualen Machine-Learning-Ansatz auf Basis einer groß angelegten Umfrage, um latente Verhaltensmuster bei der Evakuierung vor Waldbränden zu identifizieren und vorherzusagen, wobei sich zeigt, dass zwar der Evakuierungsweg aus Haushaltsmerkmalen zuverlässig prognostiziert werden kann, der Zeitpunkt der Evakuierung jedoch stark von dynamischen Brandbedingungen abhängt.

Sazzad Bin Bashar Polock, Anandi Dutta, Subasish Das2026-03-04🤖 cs.AI

Subspace Geometry Governs Catastrophic Forgetting in Low-Rank Adaptation

Die Arbeit stellt eine geometrische Theorie vor, die katastrophisches Vergessen bei Low-Rank Adaptation (LoRA) durch die Wechselwirkung von Gradienten-Unterräumen erklärt und zeigt, dass der Grad des Vergessens primär durch den minimalen Winkel zwischen diesen Unterräumen bestimmt wird, während der Adapter-Rang nur bei ähnlichen Unterräumen eine signifikante Rolle spielt.

Brady Steele2026-03-04🤖 cs.LG

Scaling Reward Modeling without Human Supervision

Die Studie zeigt, dass sich Belohnungsmodelle durch unüberwachtes Lernen aus Webdaten skalieren lassen und dabei ohne menschliche Annotationen eine Leistung erreichen, die überlegene überwachte Baseline-Modelle in Mathematik- und Sicherheitsaufgaben übertreffen oder gleichziehen.

Jingxuan Fan, Yueying Li, Zhenting Qi + 4 more2026-03-04🤖 cs.LG

Efficient Sparse Selective-Update RNNs for Long-Range Sequence Modeling

Die vorgestellte Arbeit stellt selektive-Update-RNNs (suRNNs) vor, eine nichtlineare Architektur, die durch neuronale Binärschalter den Zustand nur bei informativen Ereignissen aktualisiert, um so das Problem des Gedächtnisverfalls zu lösen und Transformer-Level-Leistung bei deutlich höherer Effizienz für die Langzeitmodellierung zu erreichen.

Bojian Yin, Shurong Wang, Haoyu Tan + 3 more2026-03-04🤖 cs.LG

Routing Absorption in Sparse Attention: Why Random Gates Are Hard to Beat

Die Studie zeigt, dass End-to-End-Sparse-Attention-Modelle durch „Routing-Absorption" scheitern, da sich die gemeinsamen Q/K/V-Parameter so stark an beliebige Masken anpassen, dass gelernte Gating-Mechanismen kaum besser funktionieren als zufällige, weshalb post-hoc-Ansätze zur Entkopplung von Repräsentationslernen und Verdünnung überlegen sind.

Keston Aquino-Michaels2026-03-04💬 cs.CL

← Zurück Weiter →