Partition-Based Functional Ridge Regression for High-Dimensional Data

Diese Arbeit stellt einen partitionsbasierten Rahmen für die funktionale Ridge-Regression vor, der durch eine differenzierte Bestrafung von dominanten und schwächeren funktionellen Effekten Multikollinearität und Überanpassung in hochdimensionalen Modellen adressiert, wobei die Konsistenz der Schätzer theoretisch bewiesen und ihre überlegene Vorhersageleistung sowie Interpretierbarkeit durch Simulationen und eine Anwendung auf kanadische Wetterdaten empirisch untermauert wird.

Shaista Ashraf, Ismail Shah, Farrukh JavedFri, 13 Ma📊 stat

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

Die Arbeit stellt Co-Diffusion vor, ein neuartiges, affinitätsbewusstes Zwei-Phasen-Framework auf Basis latenter Diffusion, das die Generalisierungsfähigkeit bei der Vorhersage von Arzneimittel-Ziel-Affinitäten, insbesondere in kalten Start-Szenarien mit neuen Molekülgerüsten und Proteinfamilien, erheblich verbessert.

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun LiuFri, 13 Ma📊 stat

Trustworthy predictive distributions for rare events via diagnostic transport maps

Diese Arbeit stellt diagnostische Transportkarten vor, die als covariatenabhängige Korrekturmechanismen dienen, um ungenaue Vorhersageverteilungen für seltene Ereignisse neu zu kalibrieren und gleichzeitig Echtzeit-Diagnosedaten über spezifische Modellfehler zu liefern, was in einer Anwendung zur Vorhersage tropischer Wirbelstürme zu verbesserten Ergebnissen im Vergleich zu operationellen Modellen führt.

Elizabeth Cucuzzella, Rafael Izbicki, Ann B. LeeFri, 13 Ma📊 stat

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

Die Arbeit stellt RIE-Greedy vor, eine Methode für kontextbasierte Banditen, die durch die Nutzung der inhärenten Stochastizität im Regularisierungsprozess beim Modelltraining eine effektive Exploration ohne zusätzliche Strategien ermöglicht und theoretisch sowie empirisch mit Thompson Sampling vergleichbare Ergebnisse liefert.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. WilliamsFri, 13 Ma📊 stat

Outrigger local polynomial regression

Die vorgestellte Arbeit führt den „Outrigger"-Schätzer für die lokale Polynomregression ein, der durch die Nutzung der bedingten Score-Funktion und einer stabilisierenden Erweiterung des Datenfensters eine Verteilungsadaptivität bei heteroskedastischen oder nicht-normalverteilten Fehlern erreicht und dabei die Minimax-Optimalität über Hölder-Klassen garantiert, ohne Annahmen über die Unabhängigkeit oder Symmetrie der Fehler zu benötigen.

Elliot H. Young, Rajen D. Shah, Richard J. SamworthFri, 13 Ma📊 stat

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Diese Arbeit stellt einen auf dem Free-Prinzip basierenden Algorithmus für das soziale Bandit-Lernen vor, der es einem Agenten ermöglicht, die Expertise anderer nicht-expertischer und diverser Agenten ohne Kenntnis ihrer Belohnungen zu schätzen und zu nutzen, um so die individuelle Lernleistung zu verbessern und logarithmische Reue zu gewährleisten.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for mm-Set Semi-Bandit Problem

Diese Arbeit zeigt, dass der Follow-the-Perturbed-Leader-Algorithmus mit Fréchet- und Pareto-Verteilungen sowie einer optimierten geometrischen Resampling-Methode für das mm-Set-Semi-Bandit-Problem sowohl im adversarischen als auch im stochastischen Setting optimale Regret-Garantien bei reduzierter rechnerischer Komplexität bietet.

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

Diese Arbeit untersucht das Phänomen des Modellkollapses durch eine lerntheoretische Analyse der Sprachgenerierung mit Replay, die zeigt, wie das Wiederaufnehmen maschinell generierter Inhalte in Trainingsdaten die Leistungsfähigkeit von Modellen unter bestimmten theoretischen Bedingungen fundamental einschränkt und dabei praktische Lösungsansätze wie Datenbereinigung sowohl bestätigt als auch ihre Grenzen aufzeigt.

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

Die Arbeit stellt die Lokale Adjazenz-Spektraleinbettung (LASE) vor, eine Methode, die durch gewichtete spektrale Zerlegung lokale, niedrigdimensionale Strukturen in Netzwerken aufdeckt und damit die Einschränkungen globaler Einbettungen überwindet, um sowohl die lokale Rekonstruktion als auch die globale Visualisierung zu verbessern.

Hannah Sansford, Nick Whiteley, Patrick Rubin-DelanchyFri, 13 Ma📊 stat