cs.LG Arbeiten | Gist.Science

Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Die vorgestellte Arbeit schlägt ein tensorfaktorisierungsbasiertes statistisches Modell vor, das kostengünstige automatische Bewertungen mit einer kleinen Menge menschlicher Referenzdaten kombiniert, um effiziente, promptgenaue Evaluierungen von Generativmodellen durchzuführen, die menschliche Präferenzen präziser vorhersagen als herkömmliche Methoden.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Federated Inference: Toward Privacy-Preserving Collaborative and Incentivized Model Serving

Dieser Artikel etabliert Federated Inference als eigenständiges, datenschutzfreundliches Paradigma für die kollaborative Modellinferenz, das durch eine systemische Analyse der zugrundeliegenden Anforderungen, Designkompromisse und praktischen Herausforderungen einen einheitlichen Rahmen für skalierbare, incentivisierte und private Inferenzsysteme bietet.

Jungwon Seo, Ferhat Ozgur Catak, Chunming Rong + 1 more2026-03-05🤖 cs.AI

Structured vs. Unstructured Pruning: An Exponential Gap

Diese Arbeit zeigt, dass beim Approximieren eines einzelnen ReLU-Neurons durch neuronales Pruning eine exponentiell größere Überparametrisierung erforderlich ist als beim unstrukturierten Gewichtspruning, was eine fundamentale theoretische Lücke zwischen den beiden Paradigmen aufdeckt.

Davide Ferre', Frédéric Giroire, Frederik Mallmann-Trenn + 1 more2026-03-05🤖 cs.AI

A Unified Revisit of Temperature in Classification-Based Knowledge Distillation

Diese Arbeit bietet eine einheitliche Untersuchung der Wechselwirkungen zwischen dem Temperaturparameter und anderen Trainingselementen bei der wissensbasierten Destillation, um praktische Leitlinien für die optimale Temperaturwahl zu entwickeln.

Logan Frank, Jim Davis2026-03-05🤖 cs.LG

Causal Learning Should Embrace the Wisdom of the Crowd

Dieses Papier plädiert für ein neues Paradigma der kausalen Lernforschung, das durch die Integration von Crowdsourcing, Expertenwissen und KI-Simulationen eine verteilte Entscheidungsfindung ermöglicht, um globale kausale Strukturen zu rekonstruieren, die für einzelne Akteure unzugänglich sind.

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

Toward Early Quality Assessment of Text-to-Image Diffusion Models

Die Arbeit stellt Probe-Select vor, eine effiziente Plug-in-Methode, die die Bildqualität von Text-zu-Bild-Generierungsmodellen bereits anhand früher Denoiser-Aktivierungen vorhersagt, um vielversprechende Samen frühzeitig auszuwählen und so die Sampling-Kosten um über 60 % zu senken, ohne das zugrunde liegende Modell zu verändern.

Huanlei Guo, Hongxin Wei, Bingyi Jing2026-03-05🤖 cs.LG

Learning in Markov Decision Processes with Exogenous Dynamics

Diese Arbeit stellt einen Lernalgorithmus für Markov-Entscheidungsprozesse mit exogenen Dynamiken vor, der durch Ausnutzung der strukturellen Unabhängigkeit der Zustandskomponenten von den Aktionen des Agenten signifikant verbesserte Regret-Schranken und eine höhere Stichprobeneffizienz im Vergleich zu herkömmlichen Reinforcement-Learning-Methoden erreicht.

Davide Maran, Davide Salaorni, Marcello Restelli2026-03-05🤖 cs.LG

AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents

AriadneMem ist ein strukturiertes Speichersystem für LLM-Agenten, das durch eine zweiphasige Pipeline mit Entropie-basiertem Filtern, konfliktbewusster Vergröberung und algorithmischer Brückenfindung die Genauigkeit bei mehrstufigen Schlussfolgerungen signifikant steigert und gleichzeitig die Laufzeit drastisch reduziert.

Wenhui Zhu, Xiwen Chen, Zhipeng Wang + 11 more2026-03-05🤖 cs.AI

Fine-Tuning and Evaluating Conversational AI for Agricultural Advisory

Die Studie stellt einen hybriden Ansatz vor, der durch Feinabstimmung auf kuratierte landwirtschaftliche Fakten und eine separate Antwort-Schicht die Genauigkeit und Sicherheit von KI-Beratungssystemen für Kleinbauern in Indien verbessert und dabei kosteneffizientere Modelle einsetzt.

Sanyam Singh, Naga Ganesh, Vineet Singh + 8 more2026-03-05🤖 cs.AI

TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement

Die Arbeit stellt TTSR vor, einen Testzeit-Trainingsrahmen, der durch einen sich selbst reflektierenden Wechsel zwischen Schüler- und Lehrer-Rollen in einem einzigen vortrainierten Modell gezielt Schwächen in der Schlussfolgerung identifiziert und durch synthetisierte Variantenfragen die reasoning-Fähigkeiten von Large Language Models kontinuierlich verbessert.

Haoyang He, Zihua Rong, Liangjie Zhao + 3 more2026-03-05🤖 cs.AI

From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings

Diese Arbeit untersucht semantisches Caching für LLM-Einbettungen, beweist die NP-Schwere optimaler Offline-Richtlinien, stellt polynomielle Heuristiken und Online-Strategien vor, die in Experimenten die Genauigkeit verbessern, und stellt den gesamten Code als Open Source bereit.

Dvir David Biton, Roy Friedman2026-03-05🤖 cs.AI

Knowledge Graph and Hypergraph Transformers with Repository-Attention and Journey-Based Role Transport

Dieser Beitrag stellt eine kompakte Dual-Stream-Architektur vor, die durch eine repository-basierte Aufmerksamkeitsmechanik mit reisebasierter Rollentransportierung Sprach- und Wissensrepräsentationen getrennt, aber durch cross-attention eng abstimmt, um gleichzeitig auf Texten und strukturierten Daten wie Wissensgraphen und Hypergraphen zu trainieren.

Mahesh Godavarti2026-03-05🤖 cs.AI

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

Die Arbeit stellt Draft-Conditioned Constrained Decoding (DCCD) vor, ein trainingfreies Zwei-Schritt-Verfahren, das durch die Entkopplung von semantischer Planung und struktureller Erzwingung die Genauigkeit strukturierter Ausgaben bei großen Sprachmodellen signifikant verbessert und dabei auch kleinere Modelle effizienter macht.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Die Arbeit stellt ein neues Paradigma namens „entropic-time inference" vor, das die LLM-Inferenz durch eine selbstorganisierende Architektur steuert, welche Scheduling, Aufmerksamkeitsverdünnung und Temperatursteuerung über ein einheitliches Entropie-Ziel vereint, um die Berechnung dort zu priorisieren, wo die Unsicherheitsreduktion maximal ist.

Andrew Kiruluta2026-03-05🤖 cs.LG

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Die Autoren stellen CoIPO, eine kontrastive Lernmethode zur Inverse Direct Preference Optimization, vor, die die inhärente Robustheit von Large Language Models gegenüber Prompt-Rauschen erhöht und dabei externe Vorverarbeitung vermeidet.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Die Arbeit stellt M-QUEST vor, ein semantisches Framework und Benchmark mit 609 Frage-Antwort-Paaren, das die automatische Extraktion von Wissen aus Memes zur Bewertung von Toxizität und Semantik ermöglicht und die Leistung von Large Language Models in diesem multimodalen Kontext evaluiert.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

Das Paper stellt IntPro vor, einen Proxy-Agenten, der durch retrieval-basierte Inferenz und gezieltes Training den Kontext sowie individuelle Intentionsmuster nutzt, um das Intentionsverständnis von Large Language Models in Mensch-KI-Interaktionen zu verbessern.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

Diese Studie untersucht die Robustheit von 13 Large Language Models gegenüber fünf Arten von Störungen im Chain-of-Thought-Reasoning und zeigt, dass die Anfälligkeit je nach Störungstyp und Modellgröße variiert, wobei insbesondere Umrechnungsaufgaben auch bei großen Modellen eine signifikante Leistungsminderung verursachen.

Ashwath Vaithinathan Aravindan, Mayank Kejriwal2026-03-05🤖 cs.AI

Prompt-Dependent Ranking of Large Language Models with Uncertainty Quantification

Diese Arbeit stellt einen Rahmen für prompt-abhängige Rankings von Large Language Models mit statistisch validen Unsicherheitsgarantien vor, der durch die Konstruktion von Konfidenzmengen auf Basis eines kontextuellen Bradley-Terry-Luce-Modells vermeintliche Rangunterschiede als statistisch nicht signifikant entlarvt und so fundierte, robuste Entscheidungsgrundlagen bietet.

Angel Rodrigo Avelar Menendez, Yufeng Liu, Xiaowu Dai2026-03-05🤖 cs.LG

Neuro-Symbolic Decoding of Neural Activity

Das Paper stellt NEURONA vor, ein neuro-symbolisches Framework zur Dekodierung von fMRI-Aktivitäten, das durch die Integration struktureller Prioritäten wie kompositioneller Prädikat-Argument-Abhängigkeiten sowohl die Genauigkeit bei präzisen Abfragen als auch die Generalisierungsfähigkeit auf ungesehene Fragen verbessert.

Yanchen Wang, Joy Hsu, Ehsan Adeli + 1 more2026-03-05🤖 cs.AI

← Zurück Weiter →