cs.LG Arbeiten | Gist.Science

Sparse Crosscoders for diffing MoEs and Dense models

Die Studie nutzt Crosscoders, um zu zeigen, dass Mixture-of-Experts-Modelle im Vergleich zu dichten Modellen weniger einzigartige Merkmale lernen und spezialisierte, fokussierte Repräsentationen entwickeln, während dichte Modelle breitere, allgemeineren Merkmale verwenden.

Marmik Chaudhari, Nishkal Hundia, Idhant Gulati2026-03-09🤖 cs.LG

MoE Lens -- An Expert Is All You Need

Die Studie zeigt, dass Mixture-of-Experts-Modelle wie DeepSeekMoE eine stark konzentrierte Expertise aufweisen, bei der nur wenige spezialisierte Experten den Großteil der Vorhersagen übernehmen, was gezielte Pruning-Strategien zur Optimierung von Inferenz und Speicherbedarf bei gleichbleibender Leistung ermöglicht.

Marmik Chaudhari, Idhant Gulati, Nishkal Hundia, Pranav Karra, Shivam Raval2026-03-09🤖 cs.LG

Margin and Consistency Supervision for Calibrated and Robust Vision Models

Die Arbeit stellt MaCS vor, ein architekturunabhängiges Regularisierungsframework, das durch die Kombination von Margin- und Konsistenzstrafen die Kalibrierung und Robustheit von Vision-Modellen verbessert, ohne zusätzliche Daten oder Architekturänderungen zu erfordern.

Salim Khazem2026-03-09🤖 cs.AI

Self-Auditing Parameter-Efficient Fine-Tuning for Few-Shot 3D Medical Image Segmentation

Die Arbeit stellt SEA-PEFT vor, eine Methode zur automatisierten, parameter-effizienten Feinabstimmung von 3D-Medizinbild-Segmentierungsmodellen, die durch einen Such-Audit-Zuweisungs-Loop die Adapter-Konfiguration optimiert und so in Few-Shot-Szenarien signifikant bessere Ergebnisse als statische Ansätze erzielt.

Son Thai Ly, Hien V. Nguyen2026-03-09🤖 cs.LG

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Diese Studie untersucht die Wirksamkeit und Grenzen des Many-Shot-Promptings als Testzeit-Anpassungsmethode für Large Language Models und zeigt, dass sie zwar bei strukturierten Aufgaben mit hohem Informationsgewinn effektiv ist, jedoch bei offenen Generierungsaufgaben stark von der Auswahlstrategie abhängt und oft nur begrenzte Vorteile bietet.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

ReflexiCoder: Teaching Large Language Models to Self-Reflect on Generated Code and Self-Correct It via Reinforcement Learning

Die Arbeit stellt ReflexiCoder vor, ein Reinforcement-Learning-Framework, das Large Language Models befähigt, Code autonom durch internalisierte Selbstreflexion und Selbstkorrektur zu verbessern, wodurch sie bei algorithmischen Aufgaben neue State-of-the-Art-Ergebnisse erzielen und dabei deutlich token-effizienter sind als herkömmliche Ansätze.

Juyong Jiang, Jiasi Shen, Sunghun Kim, Kang Min Yoo, Jeonghoon Kim, Sungju Kim2026-03-09🤖 cs.LG

Stochastic Event Prediction via Temporal Motif Transitions

Die Arbeit stellt STEP (STochastic Event Predictor) vor, ein Framework zur stochastischen Vorhersage von Ereignissen in zeitlichen Netzwerken, das durch die Modellierung von Motif-Übergängen mittels Poisson-Prozessen und Bayes'scher Bewertung bestehende Methoden in Bezug auf Genauigkeit und Effizienz deutlich verbessert.

\.Ibrahim Bahadır Altun, Ahmet Erdem Sarıyüce2026-03-09🤖 cs.LG

ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Die Arbeit stellt ROSE vor, eine optimierte Version von SparseGPT, die durch eine adaptive, verlustbasierte Neuordnung der Gewichte die Genauigkeit beim One-Shot-Pruning von Large Language Models signifikant verbessert.

Mingluo Su, Huan Wang2026-03-09🤖 cs.LG

PixARMesh: Autoregressive Mesh-Native Single-View Scene Reconstruction

Die Arbeit stellt PixARMesh vor, eine Methode, die aus einem einzelnen RGB-Bild autoregressiv vollständige, kohärente und direkt anwendbare 3D-Innenszenen-Meshes in einem einzigen Vorwärtsschritt rekonstruiert, indem sie Objektplatzierung und Geometrie in einem einheitlichen Modell kombiniert.

Xiang Zhang, Sohyun Yoo, Hongrui Wu, Chuan Li, Jianwen Xie, Zhuowen Tu2026-03-09🤖 cs.LG

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

Die vorgestellte Arbeit verbessert die Fairness und Interpretierbarkeit von Concept Bottleneck Models durch den Einsatz von drei neuen Techniken zur Reduzierung von Informationslecks, dem Entfernen voreingenommener Konzepte und adversariellem Debiasing, wodurch signifikant bessere Ergebnisse im Kompromiss zwischen Fairness und Leistung erzielt werden.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Die Arbeit stellt RePO vor, einen Optimierungsansatz, der durch die Kombination von verstärkendem Lernen zur Förderung der Exploration und einer referenzgesteuerten Überwachung zur Stabilisierung des Trainings die Leistung von Large Language Models bei der molekularen Optimierung ohne schrittweise Trajektoriendaten signifikant verbessert.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

Diese Studie stellt ein integriertes Framework vor, das eine Node-Transformer-Architektur mit BERT-basierter Sentiment-Analyse kombiniert, um durch die Modellierung von Graphstrukturen und Marktstimmungen die Vorhersagegenauigkeit von Aktienkursen signifikant zu verbessern.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

Die vorgestellte Arbeit schlägt das „Artificial Replay"-Verfahren vor, ein neues Experimentdesign, das durch Wiederverwendung aufgezeichneter Belohnungen die Anzahl notwendiger Nutzerinteraktionen zur Vergleichung von Multi-armed-Bandit-Algorithmen nahezu halbiert und dabei einen unverzerrten Schätzer mit sublinear wachsender Varianz liefert.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

Die Arbeit stellt Weak-SIGReg vor, eine effiziente Kovarianz-Regularisierungsmethode, die auf dem Prinzip der Sketched Isotropic Gaussian Regularization basiert und das Training von tiefen neuronalen Netzen wie Vision Transformern stabilisiert, indem sie den Zusammenbruch der Repräsentationen durch eine Annäherung an eine isotrope Gauß-Verteilung verhindert.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

Diese Arbeit zeigt, dass die Berücksichtigung des menschlichen Kontexts (Autoren) durch die HuLM- und HuFT-Methoden die Leistung eines größeren 8B Llama-Modells verbessert und damit die Bedeutung der Modellierung von Sprache im Kontext ihrer ursprünglichen Ersteller unterstreicht.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

Die Autoren stellen einen FPGA-beschleuniger vor, der durch die persistente Speicherung des GDN-Zustands auf dem Chip die speichergebundenen Engpässe bei der Dekodierung linearer Aufmerksamkeit überwindet und damit im Vergleich zu einer NVIDIA H100-GPU eine 4,5-fache Geschwindigkeitssteigerung sowie eine bis zu 60-fach höhere Energieeffizienz pro Token erreicht.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

Implicit Style Conditioning: A Structured Style-Rewrite Framework for Low-Resource Character Modeling

Die Arbeit stellt ein strukturiertes Stil-Umschreibungs-Framework vor, das durch explizite Entzerrung lexikalischer, syntaktischer und pragmatischer Merkmale sowie implizites Stil-Conditioning mittels CoT-Distillation es kleinen Sprachmodellen ermöglicht, auch bei geringen Datenmengen konsistente und dateneffiziente Charakterrollen zu generieren, die größere Baseline-Modelle übertreffen.

Chanhui Zhu2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

Diese Studie entwickelt interpretierbare Modelle, die psychologische Theorien über die Interaktion von Person und Situation mit Sprachdaten kombinieren, um das dynamische Wohlbefinden in sozialen Medien präziser und nachvollziehbarer zu erfassen als rein embedding-basierte Ansätze.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence

Die Arbeit stellt Omni-Masked Gradient Descent (OMGD) vor, eine speichereffiziente Optimierungsmethode für das Training großer Sprachmodelle, die durch eine nichtkonvexe Konvergenzanalyse eine verbesserte Iterationskomplexität von $\tilde{\mathcal{O}}(\epsilon^{-3})$ garantiert und sich nahtlos in bestehende Optimierer integrieren lässt.

Hui Yang, Tao Ren, Jinyang Jiang, Wan Tian, Yijie Peng2026-03-09🤖 cs.LG

TADPO: Reinforcement Learning Goes Off-road

Die Arbeit stellt TADPO vor, ein neuartiges Reinforcement-Learning-System, das eine verbesserte Policy-Gradient-Methode nutzt, um hochgeschwindigkeitsfähige Offroad-Fahrzeuge erstmals erfolgreich in der Simulation und im realen Einsatz ohne Anpassungen zu steuern.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

← Zurück Weiter →