cs.LG Arbeiten | Gist.Science

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dieser Artikel stellt einen datengestützten Ansatz vor, der durch die Kombination von Offline-Reinforcement-Learning und Überlebensanalyse optimale Preis- und Lagerstrategien für sequenzielle Entscheidungen unter zensierter und abhängiger Nachfrage ermittelt, wobei finite-Stichproben-Regressionsgrenzen die Wirksamkeit der vorgeschlagenen Algorithmen belegen.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Score Matching Diffusion Based Feedback Control and Planning of Nonlinear Systems

Dieses Papier stellt einen deterministischen, diffusionsbasierten Rahmen vor, der durch die Umkehrung eines durch Weißrauschen angeregten Vorwärtsprozesses eine Rückkopplungssteuerung für nichtlineare Systeme ableitet, um die Wahrscheinlichkeitsdichte auf eine gewünschte Zielverteilung zu lenken.

Karthik Elamvazhuthi, Darshan Gadginmath, Fabio Pasqualetti2026-03-12⚡ eess

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Die vorgestellte Arbeit stellt SwitchMT vor, eine neuartige Methode, die adaptive Task-Switching-Policies und Deep Spiking Q-Networks nutzt, um die Skalierbarkeit und Leistung von ressourcenbeschränkten autonomen Agenten beim gleichzeitigen Lernen mehrerer Aufgaben zu verbessern und dabei Task-Interferenzen ohne Erhöhung der Netzwerkkomplexität zu überwinden.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Panda: A pretrained forecast model for chaotic dynamics

Das Paper stellt Panda vor, ein vortrainiertes Modell für chaotische Dynamiken, das auf synthetischen Daten trainiert wurde und durch Null-Shot-Fähigkeiten, die Vorhersage realer experimenteller Zeitreihen sowie die spontane Generalisierung von gewöhnlichen auf partielle Differentialgleichungen ohne Nachtraining überzeugt.

Jeffrey Lai, Anthony Bao, William Gilpin2026-03-12🌀 nlin

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Diese Studie bietet eine datengestützte, halbautomatische Übersicht über die Forschung zu den Grenzen großer Sprachmodelle (LLLMs) von 2022 bis Anfang 2025, die auf einer Analyse von 14.648 relevanten Arbeiten aus 250.000 ACL- und arXiv-Publikationen basiert und zeigt, dass sich der Anteil dieser Forschung stark erhöht hat, wobei Schlussfolgern die am intensivsten untersuchte Einschränkung bleibt.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Diese Arbeit stellt einen konsistenzbasierten abduktiven Rahmen vor, der durch die logische Integration und Fehlerfilterung mehrerer vortrainierter Wahrnehmungsmodelle deren Leistung in neuen Umgebungen mit Verteilungsverschiebungen signifikant verbessert.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

CARTGen-IR: Synthetic Tabular Data Generation for Imbalanced Regression

Die Studie stellt CARTGen-IR vor, eine effiziente und interpretierbare Methode zur synthetischen Datengenerierung für tabellarische Daten mit unausgewogenen Regressionszielen, die mittels relevanz- und dichtegesteuerten Samplingverfahren ohne willkürliche Schwellenwerte realistische Stichproben erzeugt und damit die Leistung von Regressionsmodellen in extremen Wertebereichen verbessert.

António Pedro Pinheiro, Rita P. Ribeiro2026-03-12🤖 cs.LG

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Die Studie zeigt, dass bei der Prognose des Einzelhandelsumsatzes unter Bedingungen wie intermittierender Nachfrage und häufigen Produktwechseln lokale baumbasierte Ensemble-Methoden wie XGBoost komplexeren Deep-Learning-Architekturen überlegen sind und somit die Ausrichtung auf die Problemcharakteristika wichtiger ist als die architektonische Raffinesse.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Die Arbeit stellt ReLIFT vor, eine neuartige Trainingsmethode, die Reinforcement Learning mit Online-Supervised Fine-Tuning kombiniert, um die Grenzen von RL zu überwinden und Large Language Models durch das Erlernen neuer Fähigkeiten und Wissensbestände bei komplexen Fragen signifikant zu verbessern.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

Diese Arbeit definiert die Klasse der „Prefix-Scannable Models" (PSMs), die durch eine Verallgemeinerung des Parallel-Prefix-Scan-Algorithmus auf nicht-assoziative Operatoren (wie Softmax) eine einheitliche Architektur für effiziente parallele Trainings- und sequenzielle Inferenzprozesse bietet und dabei die Ausdruckskraft von Transformern mit der Recheneffizienz von State-Space-Modellen vereint.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Diese Arbeit bietet einen umfassenden Überblick über Differential Privacy im maschinellen Lernen, indem sie deren theoretische Grundlagen, die Integration in Modelle von symbolischer KI bis zu Large Language Models sowie praktische Evaluierungsmethoden untersucht, um sichere und verantwortungsvolle KI-Systeme zu fördern.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

Die Arbeit stellt K-Sil vor, eine silhouette-gesteuerte Variante des $k$ -means-Algorithmus, die durch adaptive Instanzgewichtung und weiche Mittelwertbildung robustere Clusterbildung bei Ausreißern und unscharfen Grenzen ermöglicht und auf verschiedenen Datensätzen bessere Ergebnisse als herkömmliche Methoden erzielt.

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Die Autoren stellen das Yokai Learning Environment (YLE) als neue Benchmark für die Null-Shot-Koordination vor, die durch das Verfolgen von Überzeugungen über bewegliche Karten und das Schließen unter mehrdeutigen Hinweisen bestehende Methoden herausfordert und zeigt, dass auf dem bisherigen Standardbenchmark Hanabi erzielte Fortschritte nicht unbedingt auf komplexere Szenarien verallgemeinern.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Diese Arbeit stellt den Algorithmus \texttt{SRTS} vor, der auf Thompson Sampling basiert und für die sequenzielle Maximierung der Sharpe-Ratio in stochastischen Bandit-Problemen mit gaußschen Belohnungen logarithmische, ordnungsoptimale Regret-Schranken nachweist.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Diese Arbeit beweist, dass analoge Quantensimulatoren mit globaler Kontrolle universell sind, entwickelt einen direkten optimalen Kontrollrahmen zur Überwindung experimenteller Einschränkungen und demonstriert experimentell die Realisierung komplexer Vielteilchenwechselwirkungen und topologischer Dynamik auf Rydberg-Atom-Arrays.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Dieser Artikel stellt eine schnelle Methode zur Tensor-Train-Vervollständigung vor, die unter Verwendung von Standard-Linearalgebra-Operationen und deterministischen Bedingungen ausschließlich auf Beobachtungen ganzer Fasern entlang eines einzelnen Modus basiert, um fehlende Einträge in Mehrweg-Datentensoren effizient wiederherzustellen.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Diese Arbeit stellt eine übertragbare Lösungsmethode für parametrische optimale Steuerungsprobleme vor, die durch den Einsatz von Funktionencodierern und einem Offline-Online-Deekompositionsansatz eine effiziente Zero-Shot-Anpassung an sich ändernde Zielsetzungen ermöglicht und dabei nahe-optimalen Performance bei minimalem Rechenaufwand für den Echtzeiteinsatz bietet.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Diese Arbeit erklärt theoretisch die Vorteile der Synchronisierung von trainierbarer inverser Temperatur und Bias im Sigmoid-Verlust (wie bei SigLIP), indem sie neue kombinatorische Objekte namens $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -Konstellationen einführt, um den Erfolg des Modells, die Modality Gap und die erforderliche Dimension für hochwertige Repräsentationen zu analysieren.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Die Studie demonstriert, dass Deep-Learning-Modelle wie U-Net und SCAN die Wolken- und Wolken-Schatten-Erkennung in den hyperspektralen Daten der MethanSAT- und MethaneAIR-Missionen im Vergleich zu herkömmlichen Methoden erheblich verbessern, um präzisere Methanretrievals zu ermöglichen.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Diese Studie analysiert die Abhängigkeiten zwischen Modalitäten in 23 visuellen Frage-Antwort-Benchmarks und zeigt auf, dass viele Tests unbeabsichtigt bildbasierte Abhängigkeiten verstärken, während die echte Interaktion zwischen Bild und Text oft vernachlässigt wird.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

← Zurück Weiter →

cs.LG