Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Die vorgestellte Arbeit schlägt ein tensorfaktorisierungsbasiertes statistisches Modell vor, das kostengünstige automatische Bewertungen mit einer kleinen Menge menschlicher Referenzdaten kombiniert, um effiziente, promptgenaue Evaluierungen von Generativmodellen durchzuführen, die menschliche Präferenzen präziser vorhersagen als herkömmliche Methoden.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Federated Inference: Toward Privacy-Preserving Collaborative and Incentivized Model Serving

Dieser Artikel etabliert Federated Inference als eigenständiges, datenschutzfreundliches Paradigma für die kollaborative Modellinferenz, das durch eine systemische Analyse der zugrundeliegenden Anforderungen, Designkompromisse und praktischen Herausforderungen einen einheitlichen Rahmen für skalierbare, incentivisierte und private Inferenzsysteme bietet.

Jungwon Seo, Ferhat Ozgur Catak, Chunming Rong + 1 more2026-03-05🤖 cs.AI

Prompt-Dependent Ranking of Large Language Models with Uncertainty Quantification

Diese Arbeit stellt einen Rahmen für prompt-abhängige Rankings von Large Language Models mit statistisch validen Unsicherheitsgarantien vor, der durch die Konstruktion von Konfidenzmengen auf Basis eines kontextuellen Bradley-Terry-Luce-Modells vermeintliche Rangunterschiede als statistisch nicht signifikant entlarvt und so fundierte, robuste Entscheidungsgrundlagen bietet.

Angel Rodrigo Avelar Menendez, Yufeng Liu, Xiaowu Dai2026-03-05🤖 cs.LG