cs.LG Arbeiten | Gist.Science

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

Die vorgestellte Arbeit verbessert die Fairness und Interpretierbarkeit von Concept Bottleneck Models durch den Einsatz von drei neuen Techniken zur Reduzierung von Informationslecks, dem Entfernen voreingenommener Konzepte und adversariellem Debiasing, wodurch signifikant bessere Ergebnisse im Kompromiss zwischen Fairness und Leistung erzielt werden.

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

Reference-guided Policy Optimization for Molecular Optimization via LLM Reasoning

Die Arbeit stellt RePO vor, einen Optimierungsansatz, der durch die Kombination von verstärkendem Lernen zur Förderung der Exploration und einer referenzgesteuerten Überwachung zur Stabilisierung des Trainings die Leistung von Large Language Models bei der molekularen Optimierung ohne schrittweise Trajektoriendaten signifikant verbessert.

Xuan Li, Zhanke Zhou, Zongze Li, Jiangchao Yao, Yu Rong, Lu Zhang, Bo Han2026-03-09🤖 cs.AI

Stock Market Prediction Using Node Transformer Architecture Integrated with BERT Sentiment Analysis

Diese Studie stellt ein integriertes Framework vor, das eine Node-Transformer-Architektur mit BERT-basierter Sentiment-Analyse kombiniert, um durch die Modellierung von Graphstrukturen und Marktstimmungen die Vorhersagegenauigkeit von Aktienkursen signifikant zu verbessern.

Mohammad Al Ridhawi, Mahtab Haj Ali, Hussein Al Osman2026-03-09🤖 cs.AI

Design Experiments to Compare Multi-armed Bandit Algorithms

Die vorgestellte Arbeit schlägt das „Artificial Replay"-Verfahren vor, ein neues Experimentdesign, das durch Wiederverwendung aufgezeichneter Belohnungen die Anzahl notwendiger Nutzerinteraktionen zur Vergleichung von Multi-armed-Bandit-Algorithmen nahezu halbiert und dabei einen unverzerrten Schätzer mit sublinear wachsender Varianz liefert.

Huiling Meng, Ningyuan Chen, Xuefeng Gao2026-03-09🤖 cs.LG

Weak-SIGReg: Covariance Regularization for Stable Deep Learning

Die Arbeit stellt Weak-SIGReg vor, eine effiziente Kovarianz-Regularisierungsmethode, die auf dem Prinzip der Sketched Isotropic Gaussian Regularization basiert und das Training von tiefen neuronalen Netzen wie Vision Transformern stabilisiert, indem sie den Zusammenbruch der Repräsentationen durch eine Annäherung an eine isotrope Gauß-Verteilung verhindert.

Habibullah Akbar2026-03-09🤖 cs.LG

Addressing the Ecological Fallacy in Larger LMs with Human Context

Diese Arbeit zeigt, dass die Berücksichtigung des menschlichen Kontexts (Autoren) durch die HuLM- und HuFT-Methoden die Leistung eines größeren 8B Llama-Modells verbessert und damit die Bedeutung der Modellierung von Sprache im Kontext ihrer ursprünglichen Ersteller unterstreicht.

Nikita Soni, Dhruv Vijay Kunjadiya, Pratham Piyush Shah, Dikshya Mohanty, H. Andrew Schwartz, Niranjan Balasubramanian2026-03-09🤖 cs.AI

A Persistent-State Dataflow Accelerator for Memory-Bound Linear Attention Decode on FPGA

Die Autoren stellen einen FPGA-beschleuniger vor, der durch die persistente Speicherung des GDN-Zustands auf dem Chip die speichergebundenen Engpässe bei der Dekodierung linearer Aufmerksamkeit überwindet und damit im Vergleich zu einer NVIDIA H100-GPU eine 4,5-fache Geschwindigkeitssteigerung sowie eine bis zu 60-fach höhere Energieeffizienz pro Token erreicht.

Neelesh Gupta, Peter Wang, Rajgopal Kannan, Viktor K. Prasanna2026-03-09🤖 cs.LG

Implicit Style Conditioning: A Structured Style-Rewrite Framework for Low-Resource Character Modeling

Die Arbeit stellt ein strukturiertes Stil-Umschreibungs-Framework vor, das durch explizite Entzerrung lexikalischer, syntaktischer und pragmatischer Merkmale sowie implizites Stil-Conditioning mittels CoT-Distillation es kleinen Sprachmodellen ermöglicht, auch bei geringen Datenmengen konsistente und dateneffiziente Charakterrollen zu generieren, die größere Baseline-Modelle übertreffen.

Chanhui Zhu2026-03-09🤖 cs.LG

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

Diese Studie entwickelt interpretierbare Modelle, die psychologische Theorien über die Interaktion von Person und Situation mit Sprachdaten kombinieren, um das dynamische Wohlbefinden in sozialen Medien präziser und nachvollziehbarer zu erfassen als rein embedding-basierte Ansätze.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. Boyd2026-03-09🤖 cs.AI

Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence

Die Arbeit stellt Omni-Masked Gradient Descent (OMGD) vor, eine speichereffiziente Optimierungsmethode für das Training großer Sprachmodelle, die durch eine nichtkonvexe Konvergenzanalyse eine verbesserte Iterationskomplexität von $\tilde{\mathcal{O}}(\epsilon^{-3})$ garantiert und sich nahtlos in bestehende Optimierer integrieren lässt.

Hui Yang, Tao Ren, Jinyang Jiang, Wan Tian, Yijie Peng2026-03-09🤖 cs.LG

TADPO: Reinforcement Learning Goes Off-road

Die Arbeit stellt TADPO vor, ein neuartiges Reinforcement-Learning-System, das eine verbesserte Policy-Gradient-Methode nutzt, um hochgeschwindigkeitsfähige Offroad-Fahrzeuge erstmals erfolgreich in der Simulation und im realen Einsatz ohne Anpassungen zu steuern.

Zhouchonghao Wu, Raymond Song, Vedant Mundheda, Luis E. Navarro-Serment, Christof Schoenborn, Jeff Schneider2026-03-09🤖 cs.AI

EvoESAP: Non-Uniform Expert Pruning for Sparse MoE

Die Arbeit stellt EvoESAP vor, einen evolutionären Suchrahmen, der durch die Optimierung einer nicht-uniformen Schicht-für-Schicht-Sparsität unter Verwendung der ESAP-Metrik die Leistung von Sparse-Mixture-of-Experts-Modellen bei gleichzeitiger Reduzierung des Speicherverbrauchs signifikant verbessert.

Zongfang Liu, Shengkun Tang, Boyang Sun, Zhiqiang Shen, Xin Yuan2026-03-09🤖 cs.LG

Preventing Learning Stagnation in PPO by Scaling to 1 Million Parallel Environments

Die Autoren zeigen, dass Lernstagnation bei PPO durch eine Diskrepanz zwischen Stichproben-Schätzungen und dem wahren Ziel entsteht, und beweisen, dass diese durch Skalierung auf über eine Million parallele Umgebungen und eine angepasste Hyperparameter-Strategie überwunden werden kann, was zu einer monotonen Leistungsverbesserung über eine Billion Übergänge hinweg führt.

Michael Beukman, Khimya Khetarpal, Zeyu Zheng, Will Dabney, Jakob Foerster, Michael Dennis, Clare Lyle2026-03-09🤖 cs.LG

Agnostic learning in (almost) optimal time via Gaussian surface area

Diese Arbeit verbessert die bekannten Schranken für das agnostische Lernen von Konzeptklassen mit begrenzter Gaußscher Oberflächenfläche, indem sie zeigt, dass ein Polynomgrad von $\tilde{O}(\Gamma^2 / \varepsilon^2)$ ausreicht, was zu nahezu optimalen Komplexitätsergebnissen für das Lernen von Polynom-Threshold-Funktionen im statistischen Abfragemodell führt.

Lucas Pesenti, Lucas Slot, Manuel Wiedmer2026-03-09🤖 cs.LG

Improved high-dimensional estimation with Langevin dynamics and stochastic weight averaging

Diese Arbeit zeigt, dass Langevin-Dynamik in Kombination mit der Mittelung der Iterierten die Notwendigkeit einer expliziten Landschaftsglättung umgeht und in hochdimensionalen Szenarien wie Tensor-PCA und Single-Index-Modellen mit $n \gtrsim d^{k^\star/2}$ Proben eine optimale Konvergenzrate erreicht.

Stanley Wei, Alex Damian, Jason D. Lee2026-03-09🤖 cs.LG

TempoSyncDiff: Distilled Temporally-Consistent Diffusion for Low-Latency Audio-Driven Talking Head Generation

Die Arbeit stellt TempoSyncDiff vor, einen effizienten, auf Wissenstransfer basierenden Latent-Diffusionsrahmen für audiogetriebene sprechende Köpfe, der durch Few-Step-Inferenz, Identitätsanker und zeitliche Regularisierung eine niedrige Latenz bei gleichzeitiger Verbesserung der temporalen Stabilität und Synchronisation ermöglicht.

Soumya Mazumdar, Vineet Kumar Rakesh2026-03-09🤖 cs.AI

Latent Diffusion-Based 3D Molecular Recovery from Vibrational Spectra

Die Arbeit stellt IR-GeoDiff vor, ein latentes Diffusionsmodell, das aus Infrarotspektren dreidimensionale Molekülgeometrien rekonstruiert, indem es spektrale Informationen in die Knoten- und Kantenrepräsentationen der Molekülstrukturen integriert und dabei die komplexe Beziehung zwischen spektralen Merkmalen und der räumlichen Struktur erfasst.

Wenjin Wu, Aleš Leonardis, Linjiang Chen, Jianbo Jiao2026-03-09🤖 cs.LG

Dynamic Momentum Recalibration in Online Gradient Learning

Die Arbeit stellt SGDF vor, einen neuen Optimierer, der durch die Anwendung von Prinzipien der optimalen linearen Filterung momentumgestützte Gradientenupdates dynamisch neu kalibriert, um den Kompromiss zwischen Rauschunterdrückung und Signalbewahrung zu optimieren und damit die Leistung herkömmlicher Methoden zu übertreffen.

Zhipeng Yao, Rui Yu, Guisong Chang, Ying Li, Yu Zhang, Dazhou Li2026-03-09🤖 cs.LG

Diffusion Language Models Are Natively Length-Aware

Die vorgestellte Arbeit zeigt, dass Diffusionssprachmodelle durch eine zero-shot-Mechanik zur dynamischen Vorschätzung der erforderlichen Antwortlänge aus dem latenten Prompt-Input erheblich rechnerisch effizienter werden, ohne dabei die Leistung auf gängigen Benchmarks zu beeinträchtigen.

Vittorio Rossi, Giacomo Cirò, Davide Beltrame, Luca Gandolfi, Paul Röttger, Dirk Hovy2026-03-09🤖 cs.LG

DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection

Dieses Paper stellt DQE vor, ein neuartiges, semantikbasiertes Evaluationsmaß für die Anomalieerkennung in Zeitreihen, das durch eine subregionale Partitionierung und eine Aggregation über den gesamten Schwellenwertbereich bestehende Limitationen wie Verzerrungen und Inkonsistenzen herkömmlicher Metriken überwindet.

Yuewei Li, Dalin Zhang, Huan Li, Xinyi Gong, Hongjun Chu, Zhaohui Song2026-03-09🤖 cs.LG

← Zurück Weiter →