cs.LG Arbeiten | Gist.Science

MASEval: Extending Multi-Agent Evaluation from Models to Systems

Das Paper stellt MASEval vor, ein framework-agnostisches Evaluationsframework, das nachweist, dass die Wahl des Agenten-Frameworks ebenso entscheidend für die Leistung ist wie die des zugrunde liegenden Modells, und ermöglicht somit eine systemische Analyse aller Komponenten agenter Systeme.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

Diese Arbeit zeigt theoretisch und empirisch, dass hybride Sequenzmodelle, die Transformer- und State-Space-Schichten kombinieren, bestimmte Aufgaben mit deutlich weniger Parametern und Speicherbedarf lösen können als reine Modelle und dabei überlegene Generalisierungsfähigkeiten aufweisen.

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

Die Arbeit stellt APPLV vor, ein adaptives Lernverfahren, das vortrainierte Vision-Language-Modelle nutzt, um Parameter klassischer Navigationsplanner vorherzusagen und so die Sicherheit traditioneller Ansätze mit der Generalisierungsfähigkeit moderner VLA-Modelle in komplexen Umgebungen zu vereinen.

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

Die Studie zeigt, dass kanalzentrische Modelle für private 5G-Netze die End-to-End-Durchsatzleistung unzureichend vorhersagen, da sie die dynamische Anpassung von MIMO-Schichten überbewerten, während datengetriebene Ansätze wie Gauß-Prozesse deutlich genauere Ergebnisse liefern.

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

Die vorgestellte Arbeit stellt FSbuHD vor, ein neues Feature-Selection-Modell für hybride Informationssysteme, das auf der Fuzzy-Rough-Set-Theorie basiert, die Berechnung von Fuzzy-Äquivalenzrelationen durch eine kombinierte Distanzmetrik optimiert und das Problem als Optimierungsaufgabe löst, um in normalen und optimistischen Modi effizientere Ergebnisse als bestehende Methoden zu erzielen.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Diese Arbeit führt eine umfassende Abstraktion von neun endlichen Stichproben-Bound-Familien für die selektive Vorhersage durch und stellt mit „Transfer-Informed Betting" eine neuartige Methode vor, die durch die Warm-Start-Initialisierung des WSR-Vermögensprozesses mit Risikoprofilen aus einer Quelldomain in datenarmen Szenarien engere und formal garantierte Unsicherheitsgrenzen erreicht.

Abhinaba Basu2026-03-11🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

Die Arbeit stellt FedLECC vor, eine leichte, cluster- und verlustgesteuerte Strategie zur Auswahl von Clients im Federated Learning, die unter nicht-IID-Bedingungen die Genauigkeit verbessert und gleichzeitig die Kommunikationskosten sowie die Anzahl der erforderlichen Runden signifikant reduziert.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

Die Studie stellt ein umfassendes, mehrdimensionales Bewertungsframework vor, das die Risiken der Memorierung sensibler genomischer Daten in genomischen Sprachmodellen quantifiziert und zeigt, dass eine Kombination verschiedener Angriffsmethoden für eine zuverlässige Privatsphäre-Auditing unerlässlich ist.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Diese Arbeit stellt einen vollständig differentierbaren Ansatz vor, der kontinuierlich relaxierte Bernoulli-Gatter nutzt, um überparametrisierte neuronale Netze ohne Gewichts-Training effizient in extrem spärliche, leistungsfähige Subnetze gemäß der Strong Lottery Ticket-Hypothese zu überführen.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

Die Studie stellt MedCBR vor, ein interpretierbares Framework, das klinische Leitlinien in Vision-Language-Modelle integriert, um durch eine Kombination aus multimodaler Ausrichtung und begründeter Schlussfolgerung präzise Diagnosen mit transparenten, expertenähnlichen Erklärungen zu liefern.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Diese Arbeit stellt ein hierarchisches Reinforcement-Learning-Framework vor, das digitale Netzwerkkopien und robuste adversarielle Verluste nutzt, um gemeinsam die Antennenneigung und die Datenquellenstrategie in mobilen Netzen zu optimieren und dabei die Datenerfassungsverzögerung signifikant zu reduzieren.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

Das Paper stellt „Guardian" vor, ein interpretierbares, dreischichtiges Entscheidungssystem, das mithilfe von Markov-Ketten, Reinforcement Learning und LLM-basierter Qualitätsprüfung aus unstrukturierten Daten dynamische Suchpläne für vermisste Kinder innerhalb der ersten 72 Stunden erstellt.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

Das Paper stellt BiCLIP vor, einen extrem einfachen und parameterarmen Rahmen, der durch eine strukturierte geometrische Transformation multimodaler Merkmale, die auf wenigen Ankerpunkten basiert, das Zero-Shot-Lernen von Vision-Language-Modellen in spezialisierten Domänen auf den Stand des Kunstzustands bringt.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

Die Arbeit stellt ULFS-KDPE vor, einen Kernel-basierten Entzerrungs-Schätzer, der auf einem universellen ungünstigsten Teilmodell beruht und in nichtparametrischen Modellen semiparametrische Effizienz für Pfad-differenzierbare Parameter erreicht, ohne dass eine explizite Berechnung der effizienten Einflussfunktionen erforderlich ist.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Towards Reliable Simulation-based Inference

Diese Dissertation adressiert das Problem übermäßiger Selbstsicherheit bei simulationsbasierten Inferenzmethoden durch die Entwicklung und Evaluierung von Regularisierungstechniken wie „Balancing" sowie durch den Einsatz maßgeschneiderter Bayesianischer neuronaler Netze, um zuverlässigere und besser kalibrierte statistische Schlussfolgerungen zu gewährleisten.

Arnaud Delaunoy2026-03-11🤖 cs.LG

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Die Arbeit stellt Guardian vor, ein konsensgesteuertes Multi-LLM-System mit QLoRA-Feinabstimmung, das spezialisierte Modelle und einen Konsens-Engine koordiniert, um die Informationsgewinnung und Suchplanung bei Vermisstenfällen in den kritischen ersten 72 Stunden zu unterstützen.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

A Survey of Reinforcement Learning For Economics

Diese Arbeit führt Ökonomen in Reinforcement-Learning-Methoden ein, die als flexible, aber fehleranfällige Erweiterung der klassischen dynamischen Programmierung dienen, um hochdimensionale wirtschaftliche Probleme zu lösen, wobei ihre Anwendung jedoch durch praktische Einschränkungen und die Notwendigkeit genauer Simulatoren begrenzt bleibt.

Pranjal Rawat2026-03-11🤖 cs.LG

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

Die Arbeit führt die $qs$ -Ungleichung ein, um zu zeigen, dass Mixture-of-Experts-Modelle aufgrund einer doppelten Ineffizienz bei der Inferenz – nämlich fragmentierter Gewichtswiederverwendung und begrenztem HBM-Speicher für den KV-Cache – bei langen Kontexten strukturell gegenüber dichteren Modellen benachteiligt sind, was ihre Trainings-FLOP-Effizienz nicht auf die Laufzeitleistung überträgt.

Vignesh Adhinarayanan, Nuwan Jayasena2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

Die Arbeit stellt das SLoD-Framework vor, das durch Wärmeleitungs-Diffusion auf hyperbolischen Mannigfaltigkeiten eine kontinuierliche Zoom-Funktion für Wissensgraphen ermöglicht und dabei automatisch qualitative Abstraktionsgrenzen durch spektrale Lücken identifiziert.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

Die Arbeit stellt MAcPNN vor, ein dezentrales Lernparadigma für IoT-Datenströme, das auf Vygotskys soziokultureller Theorie basiert und autonome Geräte durch bedarfsgesteuerte gegenseitige Unterstützung sowie kontinuierliche progressive neuronale Netze (cPNN) befähigt, Konzeptdrifts zu bewältigen und Vergessen zu vermeiden, ohne einen zentralen Koordinator zu benötigen.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG

← Zurück Weiter →

cs.LG