cs.LG Arbeiten | Gist.Science

Efficient Agent Training for Computer Use

Das Paper stellt PC Agent-E vor, ein effizientes Trainingsframework, das durch die Kombination von nur 312 menschlichen Demonstrationsdaten mit synthetisierten Alternativen mittels Claude 3.7 Sonnet die Leistung von Computer-Nutzungs-Agenten signifikant steigert und dabei sowohl reine Menschendaten als auch direkte Distillation von Claude 3.7 Sonnet auf dem neuen Benchmark WindowsAgentArena-V2 übertrifft.

Yanheng He, Jiahe Jin, Pengfei Liu2026-03-04🤖 cs.AI

Know When to Abstain: Optimal Selective Classification with Likelihood Ratios

Diese Arbeit stellt neue Methoden für die selektive Klassifizierung unter Kovariatenverschiebung vor, die auf dem Neyman-Pearson-Lemma basieren und durch Likelihood-Verhältnisse eine robustere Leistung als bestehende Ansätze erzielen.

Alvin Heng, Harold Soh2026-03-04📊 stat

Automatic and Structure-Aware Sparsification of Hybrid Neural ODEs

Die vorgestellte Arbeit entwickelt einen automatisierten, struktur-bewussten Ansatz zur Sparsifizierung hybrider neuronaler ODEs durch eine Kombination aus domäneninformierten Graph-Modifikationen und datengesteuerter Regularisierung, um in datenarmen medizinischen Szenarien die Vorhersagegenauigkeit und Stabilität zu verbessern, ohne die mechanistische Plausibilität zu verlieren.

Bob Junyi Zou, Lu Tian2026-03-04📊 stat

NatADiff: Adversarial Boundary Guidance for Natural Adversarial Diffusion

Die Arbeit stellt NatADiff vor, eine Methode zur Erzeugung natürlicher adversarieller Beispiele mittels Diffusionsmodellen und adversarialer Grenzführung, die durch das gezielte Ausnutzen struktureller Gemeinsamkeiten zwischen Klassen sowohl die Übertragbarkeit von Angriffen verbessert als auch eine höhere Übereinstimmung mit realen Testzeitfehlern erreicht.

Max Collins, Jordan Vice, Tim French + 1 more2026-03-04🤖 cs.LG

Optimizing Data Augmentation through Bayesian Model Selection

Diese Arbeit stellt ein neuartiges Framework vor, das Daten-Augmentations-Parameter als Modellhyperparameter behandelt und durch die Optimierung der marginalen Likelihood mittels eines abgeleiteten ELBO eine robuste, bayesianisch fundierte Auswahl von Augmentierungsstrategien ermöglicht, die sich in verbesserten Generalisierungs- und Kalibrierungsergebnissen auf Computer-Vision- und NLP-Aufgaben zeigt.

Madi Matymov, Ba-Hien Tran, Michael Kampffmeyer + 2 more2026-03-04📊 stat

Weight-Space Linear Recurrent Neural Networks

Die Arbeit stellt WARP vor, ein neuartiges Modell, das das Lernen im Gewichtsraum mit linearer Rekurrenz vereint, indem es den verborgenen Zustand als Parameter eines Hilfsnetzwerks parametrisiert, was effiziente testzeitliche Anpassung, In-Context-Learning und die Integration physikalischer Priors ermöglicht und dabei auf vielfältigen Aufgaben den Stand der Technik erreicht oder übertrifft.

Roussel Desmond Nzoyem, Nawid Keshtmand, Enrique Crespo Fernandez + 4 more2026-03-04🤖 cs.LG

Dynamic Manifold Hopfield Networks for Context-Dependent Associative Memory

Die vorgestellte Arbeit führt Dynamic Manifold Hopfield Networks (DMHN) ein, ein datengetriebenes dynamisches Modell, das durch kontextabhängige Deformation der Attraktor-Manifold-Geometrie eine überlegene Kapazität und Robustheit bei der assoziativen Gedächtniswiedergabe im Vergleich zu klassischen Hopfield-Netzwerken erreicht.

Chong Li, Taiping Zeng, Xiangyang Xue + 1 more2026-03-04🧬 q-bio

Learning of Population Dynamics: Inverse Optimization Meets JKO Scheme

Die Arbeit stellt $\texttt{iJKOnet}$ vor, eine neue Methode zur Lernung von Populationsdynamiken, die das JKO-Schema mit inverser Optimierung kombiniert und dabei auf restriktive Architekturen verzichtet, um eine effiziente End-to-End-Training sowie verbesserte Leistung und theoretische Garantien zu ermöglichen.

Mikhail Persiianov, Jiawei Chen, Petr Mokrov + 3 more2026-03-04📊 stat

Interaction Field Matching: Overcoming Limitations of Electrostatic Models

Diese Arbeit stellt die Interaction Field Matching (IFM)-Methode vor, eine Verallgemeinerung des elektrostatischen Field Matching, die durch die Einführung eines speziellen Wechselwirkungsfelds die Modellierungsschwierigkeiten elektrostatischer Felder überwindet und sich für Aufgaben der Datengenerierung und -übertragung eignet.

Stepan I. Manukhov, Alexander Kolesov, Vladimir V. Palyulin + 1 more2026-03-04🤖 cs.AI

DiaBlo: Diagonal Blocks Are Sufficient For Finetuning

Die Arbeit stellt DiaBlo vor, eine effiziente Methode zum Feinabstimmen von Sprachmodellen, die durch die Aktualisierung ausschließlich der Diagonalblöcke in Gewichtsmatrizen eine stabile Konvergenz und Leistung erzielt, die mit der des vollständigen Feinabstimmens vergleichbar ist, ohne dabei auf komplexe Hilfsinitialisierungen angewiesen zu sein.

Selcuk Gurses, Aozhong Zhang, Yanxia Deng + 5 more2026-03-04🤖 cs.AI

Search Arena: Analyzing Search-Augmented LLMs

Die Arbeit stellt „Search Arena" vor, einen groß angelegten, crowdsourceden Datensatz mit über 24.000 menschlichen Präferenzbewertungen für suchgestützte LLMs, der neue Erkenntnisse über die Glaubwürdigkeit von Zitaten und die Leistungsfähigkeit solcher Systeme in verschiedenen Szenarien liefert.

Mihran Miroyan, Tsung-Han Wu, Logan King + 8 more2026-03-04💬 cs.CL

RNE: plug-and-play diffusion inference-time control and energy-based training

Diese Arbeit stellt den Radon-Nikodym-Schätzer (RNE) vor, einen plattformunabhängigen Ansatz, der auf Dichteverhältnissen basiert, um die Schätzung von Randdichten, die Steuerung von Diffusionsmodellen zur Inferenzzeit und das energiebasierte Training unter einem einheitlichen Rahmenwerk zu vereinen.

Jiajun He, José Miguel Hernández-Lobato, Yuanqi Du + 1 more2026-03-04📊 stat

Perception-R1: Advancing Multimodal Reasoning Capabilities of MLLMs via Visual Perception Reward

Das Paper stellt Perception-R1 vor, eine Methode, die durch einen neuartigen visuellen Wahrnehmungsbelohnung im Rahmen des Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) die multimodale Wahrnehmung und Schlussfolgerungsfähigkeit von Large Multimodal Models (MLLMs) verbessert und dabei mit nur 1.442 Trainingsdaten state-of-the-art Ergebnisse auf mehreren Benchmarks erzielt.

Tong Xiao, Xin Xu, Zhenya Huang + 4 more2026-03-04🤖 cs.AI

Tailored Behavior-Change Messaging for Physical Activity: Integrating Contextual Bandits and Large Language Models

Diese Studie stellt einen hybriden Ansatz vor, der kontextuelle Banditen zur Auswahl von Interventionsarten mit großen Sprachmodellen zur personalisierten Inhaltsgenerierung kombiniert, um in einer 30-tägigen physischen Aktivitätsintervention die Akzeptanz zu erhöhen, den Token-Verbrauch zu senken und eine nachvollziehbare, adaptive Entscheidungsfindung zu ermöglichen.

Haochen Song, Dominik Hofer, Rania Islambouli + 6 more2026-03-04📊 stat

StreamSplat: Towards Online Dynamic 3D Reconstruction from Uncalibrated Video Streams

StreamSplat ist ein vollständig feed-forward Framework, das unkalibrierte Videostreams beliebiger Länge online und in Echtzeit in dynamische 3D-Gaussian-Splatting-Repräsentationen umwandelt und dabei durch probabilistische Sampling-Mechanismen, ein bidirektionales Deformationsfeld sowie adaptive Fusion eine bisher unerreichte Geschwindigkeit und Rekonstruktionsqualität ohne Optimierungsschritte erreicht.

Zike Wu, Qi Yan, Xuanyu Yi + 2 more2026-03-04🤖 cs.LG

Constructing Extreme Heatwave Storylines with Differentiable Climate Models

Die Studie stellt ein neuartiges Framework vor, das differenzierbare Hybridklimamodelle nutzt, um physikalisch konsistente Worst-Case-Hitzewellen-Szenarien zu generieren, die deutlich intensiver sind als die extremsten Mitglieder herkömmlicher Ensemble-Simulationen.

Tim Whittaker, Alejandro Di Luca2026-03-04🤖 cs.LG

Saturation Self-Organizing Map

Dieses Paper stellt SatSOM vor, eine Erweiterung von Self-Organizing Maps, die durch einen neuartigen Sättigungsmechanismus, der die Lernrate und Nachbarschaftsgröße erfahrener Neuronen reduziert, das katastrophale Vergessen beim kontinuierlichen Lernen effektiv verhindert.

Igor Urbanik, Paweł Gajewski2026-03-04🤖 cs.AI

An Explainable and Interpretable Composite Indicator Based on Decision Rules

Dieser Artikel stellt einen neuartigen Rahmen vor, der auf dem Dominanzbasierten Rauschen-Set-Ansatz und aussagekräftigen Wenn-dann-Regeln basiert, um transparente und interpretierbare Composite-Indikatoren zu konstruieren, die sowohl für diskrete Klassifikationen als auch für kontinuierliche Scores mit fehlenden Werten anwendbar sind.

Salvatore Corrente, Salvatore Greco, Roman Słowiński + 1 more2026-03-04🤖 cs.LG

LLM Probability Concentration: How Alignment Shrinks the Generative Horizon

Die Studie zeigt, dass die Ausrichtung (Alignment) von Large Language Models die Vielfalt der Generierung durch eine signifikante Reduktion des „Branching Factor" – ein Maß für die Anzahl plausibler Folgetokens – drastisch einschränkt, indem sie das Modell in deterministischere Pfade lenkt, was sowohl die geringere Sensitivität gegenüber Dekodierungsstrategien als auch die Stabilität von Chain-of-Thought-Verfahren erklärt.

Chenghao Yang, Sida Li, Ari Holtzman2026-03-04🤖 cs.AI

Navigating with Annealing Guidance Scale in Diffusion Space

Die vorgestellte Arbeit stellt einen neuartigen, speicher- und aktivierungsfreien Annealing-Guidance-Scheduler vor, der die Guidance-Skala in Diffusionsmodellen dynamisch anpasst, um die Bildqualität und die Textübereinstimmung im Vergleich zur herkömmlichen Classifier-Free Guidance signifikant zu verbessern.

Shai Yehezkel, Omer Dahary, Andrey Voynov + 1 more2026-03-04🤖 cs.AI

← Zurück Weiter →