cs.LG Arbeiten | Gist.Science

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Die Studie stellt X-MethaneWet vor, den ersten globalen Benchmark-Datensatz für Feuchtgebiet-Methanemissionen, der physikalische Simulationen mit Felddaten kombiniert, um durch den Einsatz von Deep-Learning-Modellen und Transfer-Learning-Techniken die Genauigkeit und Skalierbarkeit von KI-gestützten Klimamodellen zu verbessern.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Diese Arbeit entwickelt ein theoretisches Rahmenwerk für die optimale Steuerung von Wahrscheinlichkeitsdichten auf Maßräumen, das ein Maximum-Prinzip und die Hamilton-Jacobi-Bellman-Gleichung für unendlichdimensionale Verteilungsräume bereitstellt und durch einen skalierbaren Algorithmus mit tiefen neuronalen Netzen zur Lösung von Großraum-Multi-Agenten-Problemen ergänzt wird.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

Die Arbeit stellt VISTA vor, ein trainingsfreies Framework, das multimodale Vision-Language-Modelle nutzt, um durch die Kombination von Text und Diagrammen historische Aktienkurse zu analysieren und zukünftige Werte präziser vorherzusagen als herkömmliche unimodale Ansätze.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Diese Arbeit stellt eine neue Methode vor, die durch das Einfügen von instruction-hierarchie-Signalen in die Zwischendarstellungen von Sprachmodellen die Anfälligkeit für Prompt-Injection-Angriffe im Vergleich zu bestehenden Ansätzen um das 1,6- bis 9,2-fache reduziert, ohne die Nützlichkeit des Modells signifikant zu beeinträchtigen.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Die vorgestellte Arbeit führt OCN (Orthogonal Common Neighbor) ein, eine neue Methode zur Link-Vorhersage, die durch Orthogonalisierung und Normalisierung Redundanz und Over-Smoothing bei höherordentlichen gemeinsamen Nachbarn adressiert und dadurch die Leistung bestehender Ansätze signifikant verbessert.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Die Arbeit stellt ViTaPEs vor, einen Transformer-basierten Ansatz, der durch eine neuartige zweistufige Positionscodierung visuell-taktile Repräsentationen lernt, um die multimodale Ausrichtung zu verbessern und sowohl in verschiedenen Erkennungsaufgaben als auch bei der Generalisierung auf unbekannte Szenarien und Robotergriffaufgaben den aktuellen Stand der Technik zu übertreffen.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

Das Paper stellt LoFT vor, eine neue Low-Rank-Adaptionsmethode, die durch die Projektion der Optimierer-Momente in den gleichen Unterraum wie die Gewichtsaktualisierung die Leistung von Full Fine-Tuning erreicht, ohne die Inferenzkosten zu erhöhen oder zusätzliche Hyperparameter zu benötigen.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Die Arbeit stellt Progressive Neural Collapse (ProNC) vor, ein neuartiges Framework für das kontinuierliche Lernen, das durch die schrittweise Erweiterung eines ETF-Ziels ohne starre globale Vorgaben das katastrophale Vergessen effektiv mindert und dabei die Leistung bestehender Basismethoden deutlich übertrifft.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Diese Arbeit stellt eine neuartige, adaptive Korrekturmethode vor, die durch einen leichtgewichtigen lernbaren Operator sicherstellt, dass neuronale Operatoren physikalische Erhaltungssätze strikt einhalten, wodurch sowohl die Genauigkeit als auch die Stabilität bei der Lösung von partiellen Differentialgleichungen im Vergleich zu bestehenden Ansätzen signifikant verbessert werden.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

Der Artikel stellt ActivePusher vor, ein Framework, das durch die Kombination von Residual-Physics-Modellierung und unsicherheitsbasiertem Active Learning die Dateneffizienz und Planungserfolgsrate bei nichtgreifenden Manipulationsaufgaben wie Schieben verbessert.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

Die Arbeit stellt MMTU vor, ein umfassendes Benchmark mit über 28.000 Fragen zu 25 realen Tabellenaufgaben, das die aktuellen Grenzen von KI-Modellen bei der Experten-Nutzung strukturierter Daten aufzeigt und als Impuls für zukünftige Fortschritte dient.

Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish2026-03-10🤖 cs.LG

Leveraging chaotic transients in the training of artificial neural networks

Die Studie zeigt, dass künstliche neuronale Netze durch das Ausnutzen von chaotischen Transienten bei ungewöhnlich hohen Lernraten in einen Zustand des Gleichgewichts zwischen Exploration und Exploitation übergehen, was zu einer signifikanten Beschleunigung des Trainings führt.

Pedro Jiménez-González, Miguel C. Soriano, Lucas Lacasa2026-03-10🤖 cs.LG

EROICA: Online Performance Troubleshooting for Large-scale Model Training

Das Paper stellt EROICA vor, ein Online-Troubleshooting-System, das durch feinkörnige Profilierung und differenzielle Beobachtbarkeit Leistungsprobleme in großen GPU-Clustern für das Training großer Modelle effizient diagnostiziert und sich bereits erfolgreich in einer Produktionsumgebung mit rund 100.000 GPUs bewährt hat.

Yu Guan, Zhiyu Yin, Haoyu Chen, Sheng Cheng, Chaojie Yang, Kun Qian, Tianyin Xu, Pengcheng Zhang, Yang Zhang, Hanyu Zhao, Yong Li, Wei Lin, Dennis Cai, Ennan Zhai2026-03-10🤖 cs.LG

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

Die Arbeit stellt BemaGANv2 vor, einen fortschrittlichen GAN-basierten Vocoder für die hochauflösende Langzeit-Audiogenerierung, der durch den Einsatz von AMP-Modulen im Generator und einer systematischen Evaluierung verschiedener Diskriminator-Kombinationen (insbesondere MED und MRD) zeitliche Kohärenz und harmonische Struktur über längere Zeiträume verbessert.

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon2026-03-10🤖 cs.LG

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Die Arbeit stellt Co-LoRA vor, eine Methode zur personalisierten Federated Learning, die durch eine aufgabenrelevante Aggregationsstrategie und ein dimensionsinvariantes Modul sowohl Daten- als auch Modellheterogenität in realistischen, multimodalen Szenarien effektiv adressiert und dabei den aktuellen Stand der Technik übertrifft.

Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars2026-03-10🤖 cs.LG

Efficient Algorithms for Logistic Contextual Slate Bandits with Bandit Feedback

Die Autoren stellen zwei effiziente Algorithmen, Slate-GLM-OFU und Slate-GLM-TS, für das Problem der logistischen kontextuellen Slate-Banditen mit Bandit-Feedback vor, die durch lokale Planung und globales Lernen ein sublineares Regret von $\tilde{O}(\sqrt{T})$ bei niedriger Rechenkomplexität erreichen und sich erfolgreich für die Auswahl von In-Context-Beispielen in Sprachmodellen einsetzen lassen.

Tanmay Goyal, Gaurav Sinha2026-03-10🤖 cs.LG

Sharpness-Aware Machine Unlearning

Die Arbeit zeigt, dass Sharpness-Aware Minimization (SAM) das Maschinelle Vergessen verbessert, indem sie die Signalstärke optimiert, und schlägt mit „Sharp MinMax" eine neue Methode vor, die durch die Aufteilung des Modells in einen SAM-basierten Lern- und einen Sharpness-Maximierungs-basierten Vergessensprozess die Entanglement zwischen behaltenen und vergessenen Daten reduziert und die Sicherheit gegen Angriffe erhöht.

Haoran Tang, Rajiv Khanna2026-03-10🤖 cs.LG

Kolmogorov-Arnold Energy Models: Fast, Interpretable Generative Modeling

Die Arbeit stellt das Kolmogorov-Arnold Energy Model (KAEM) vor, ein generatives Modell, das durch eine univariate latente Struktur und die Kolmogorov-Arnold-Darstellungstheorie eine schnelle, exakte Inferenz sowie verbesserte Interpretierbarkeit ermöglicht und dabei die Effizienz von VAEs mit der Ausdruckskraft von Energie-basierten Modellen verbindet.

Prithvi Raj2026-03-10🤖 cs.LG

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

Die Autoren stellen einen halb-selbstüberwachten Lernansatz namens GLMask vor, der mit minimaler manueller Annotation eine hochleistungsfähige Instanzsegmentierung ermöglicht und sowohl bei der Erkennung von Weizenähren als auch auf dem COCO-Datensatz neue State-of-the-Art-Ergebnisse erzielt.

Keyhan Najafian, Farhad Maleki, Lingling Jin, Ian Stavness2026-03-10🤖 cs.LG

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Die Arbeit stellt SamS vor, einen effizienten Algorithmus, der durch adaptive, batch-basierte Stichprobenplanung den Direct Preference Optimization (DPO) für Large Language Models verbessert, indem er die sich entwickelnden Modellzustände während des Trainings berücksichtigt, ohne den Kernalgorithmus zu verändern.

Zixuan Huang, Yikun Ban, Lean Fu, Xiaojie Li, Zhongxiang Dai, Jianxin Li, Deqing Wang2026-03-10🤖 cs.LG

← Zurück Weiter →