cs.LG Arbeiten | Gist.Science

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

Die Arbeit stellt SeGP-CL vor, eine exemplarfreie Methode zum kontinuierlichen Lernen von Vision-Language-Modellen, die durch die Erhaltung der semantisch-geometrischen Struktur mittels adversarischer Anker und geometrischer Distillation katastrophales Vergessen verhindert und gleichzeitig die Stabilität sowie den Vorwärts-Transfer verbessert.

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Die Arbeit beweist mathematisch und durch numerische Experimente, dass chemische Reaktionsnetzwerke ohne versteckte Schichten bestimmte Klassifizierungsaufgaben effizienter und genauer lösen können als Spiking-Neuronale-Netzwerke, die dafür versteckte Schichten benötigen.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Die Studie stellt ein auf Temporal Convolutional Networks basierendes Multi-Label-Deep-Learning-Framework vor, das die Vorhersage von Transkriptionsfaktor-Bindungsstellen verbessert, indem es kooperative Mechanismen und Korrelationen zwischen verschiedenen Transkriptionsfaktoren erfasst.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

Die Arbeit stellt QAvatar vor, einen hybriden Kritiker, der durch die Einführung der Bellman-Konsistenz über Domänen hinweg die Daten-effizienz im Cross-Domain-Reinforcement-Learning verbessert, indem er Quell- und Ziel-Q-Funktionen adaptiv kombiniert, um negative Übertragungseffekte zu vermeiden und eine zuverlässige Wissensübertragung in verschiedenen Robotik-Aufgaben zu gewährleisten.

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Die Autoren stellen eine ressourceneffiziente, iterative Neural-Architecture-Search-Methode vor, die große Sprachmodelle mit einem speicherbasierten Feedback-Mechanismus kombiniert, um auf einer einzelnen Consumer-GPU ohne Feinabstimmung der Modelle kompakte und leistungsfähige Bildklassifizierungsarchitekturen zu entwerfen.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Diese Arbeit stellt einen neuen Ansatz für das Batch-Bayes'sche Optimal-Experiment-Design vor, der das Optimierungsproblem durch eine probabilistische Hebung in den Raum der Wahrscheinlichkeitsmaße transformiert und unter Verwendung von Wasserstein-Gradientenflüssen skalierbare, partikelbasierte Algorithmen entwickelt, um hochdimensionale und nicht-konvexe Nutzenfunktionen effizient zu optimieren.

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Diese Arbeit stellt MMDDPG vor, ein Framework, das durch die Formulierung eines Minimax-Optimierungsproblems mit einem fraktionalen Ziel, das Leistung und Störungsstärke ausbalanciert, robuste Steuerungsstrategien für kontinuierliche Aufgaben unter Unsicherheit und externen Störungen entwickelt.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

Cornserve ist ein verteiltes Serving-System, das auf Kubernetes basiert und durch flexible Aufgabenabstraktion sowie eine effiziente Record-and-Replay-Ausführung die Skalierbarkeit und Leistung von beliebigen Any-to-Any-Multimodalmodellen mit bis zu 3,81-fach höherem Durchsatz und 5,79-fach niedrigerer Tail-Latenz verbessert.

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

Die Arbeit stellt Hoi3DGen vor, ein Framework, das mithilfe von multimodalen großen Sprachmodellen hochwertige, textgetreue 3D-Meshes für Mensch-Objekt-Interaktionen generiert und dabei bestehende Methoden in Bezug auf Textkonsistenz und Modellqualität deutlich übertrifft.

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

Automatic Generation of High-Performance RL Environments

Diese Arbeit stellt eine wiederverwendbare Methode vor, die komplexe Reinforcement-Learning-Umgebungen mithilfe von KI-Agenten, hierarchischer Verifizierung und iterativer Reparatur automatisch in hochoptimierte Implementierungen übersetzt, wodurch die Entwicklungszeit drastisch verkürzt und die Trainingsgeschwindigkeit um Größenordnungen gesteigert wird.

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

Die Arbeit stellt FlashMotion vor, ein neuartiges Trainingsframework, das durch eine spezielle Hybrid-Strategie aus Diffusions- und adversariellen Zielen die Lücke zwischen Few-Step-Video-Generierung und präziser Trajektoriensteuerung schließt und dabei sowohl die Bildqualität als auch die Bewegungsgenauigkeit im Vergleich zu bestehenden Methoden verbessert.

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Die Studie „IsoCompute Playbook" leitet berechnungsoptimale Regeln für die Allokation von Sampling-Ressourcen beim Reinforcement Learning von Large Language Models ab und zeigt, wie sich die Anzahl paralleler Rollouts je Problem je nach Budget und Schwierigkeitsgrad gezielt skalieren lässt, um Stabilität und Effizienz zu maximieren.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

A Quantitative Characterization of Forgetting in Post-Training

Diese Arbeit liefert eine quantitative Charakterisierung des Vergessens beim Nachtrainieren generativer Modelle, indem sie zeigt, wie die Wahl der Divergenzrichtung (Forward- vs. Reverse-KL), die geometrische Überlappung der Aufgaben und das Sampling-Verfahren das Ausmaß von Massenverlust und Komponentenverschiebung bestimmen.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

Die Arbeit stellt „Proof-Carrying Materials" (PCM) vor, ein dreistufiges Verfahren aus adversarieller Fälschung, Bootstrap-Verfeinerung und formaler Verifizierung, das die Zuverlässigkeit maschinengelernter Interatomarer Potentiale sicherstellt und deren Nachweisfähigkeit für die Entdeckung stabiler Materialien im Vergleich zu herkömmlichen Filtern um 25 % steigert.

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

Die Arbeit stellt IndexCache vor, eine Methode zur Beschleunigung von Sparse Attention in großen Sprachmodellen, die durch die Wiederverwendung von Index-Informationen zwischen Schichten die Rechenkosten des Indexers um 75 % senkt und dabei die Modellqualität nahezu unverändert lässt.

Yushi Bai, Qian Dong, Ting Jiang, Xin Lv, Zhengxiao Du, Aohan Zeng, Jie Tang, Juanzi Li2026-03-13💬 cs.CL

HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

Die Arbeit stellt HiAP vor, ein neuartiges Framework zur stochastischen, mehrstufigen automatischen Pruning von Vision Transformern, das durch die gleichzeitige Optimierung von Makro- und Mikro-Granularitäten in einem einzigen End-to-End-Trainingsschritt effiziente Subnetzwerke ohne manuelle Heuristiken oder mehrstufige Pipelines erzeugt.

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis2026-03-13🤖 cs.LG

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

Diese Arbeit stellt einen Ansatz vor, der Fuzzy-Regeln und Textverarbeitungstechniken nutzt, um die domänenspezifischen Einschränkungen von CLIP-Embeddings zu überwinden und deren Interpretierbarkeit in klinischen Berichten sowie Filmrezensionen zu verbessern.

Javier Fumanal-Idocin, Mohammadreza Jamalifard, Javier Andreu-Perez2026-03-13🤖 cs.LG

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

Die Arbeit zeigt, dass in großen vortrainierten Modellen diverse aufgabenspezifische Experten dicht um die Gewichte verteilt sind, sodass eine einfache Methode zum zufälligen Stören und Auswählen der besten Parameter in der Lage ist, mit etablierten Nachtrainingsverfahren wie PPO oder ES mitzuhalten.

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Security Considerations for Artificial Intelligence Agents

Dieser Artikel fasst Perplexitys Erfahrungen mit der Sicherheit von KI-Agenten zusammen, identifiziert neue Angriffsvektoren wie indirekte Prompt-Injection und verwirrte Stellvertreter, bewertet mehrschichtige Verteidigungsstrategien und formuliert Empfehlungen für zukünftige Sicherheitsstandards im Einklang mit NIST-Richtlinien.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Temporal Straightening for Latent Planning

Die Arbeit stellt eine neue Methode namens „Temporal Straightening" vor, die durch die Regularisierung latenter Trajektorien auf gerade Linien die Stabilität und Erfolgsrate gradientenbasierter Planung in Weltmodellen für Ziel-Erreichungsaufgaben signifikant verbessert.

Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren2026-03-13🤖 cs.LG

← Zurück Weiter →