cs.LG Arbeiten | Gist.Science

Deep Learning Network-Temporal Models For Traffic Prediction

Diese Arbeit stellt zwei Deep-Learning-Modelle – einen maßgeschneiderten Graph-Attention-Netzwerk-Ansatz und einen feinabgestimmten multimodalen Large Language Model – zur Vorhersage von Netzwerkdaten vor, die im Vergleich zu LSTM-Modellen überlegene Generalisierungsfähigkeit bzw. eine reduzierte Vorhersagevarianz aufweisen.

Yufeng Xin, Ethan Fan2026-03-13🤖 cs.LG

Leveraging Phytolith Research using Artificial Intelligence

Die Studie stellt „Sorometry" vor, eine künstliche Intelligenz-basierte Pipeline, die durch die Kombination von 2D-Bild- und 3D-Punktwolkenanalyse sowie bayesscher Modellierung die manuelle Phytolithen-Analyse automatisiert, die Klassifizierungsgenauigkeit verbessert und die Rekonstruktion vergangener Vegetation auf ein „Omics"-Skalenniveau hebt.

Andrés G. Mejía Ramón, Kate Dudgeon, Nina Witteveen, Dolores Piperno, Michael Kloster, Luigi Palopoli, Mónica Moraes R., José M. Capriles, Umberto Lombardo2026-03-13🧬 q-bio

Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents

Die Arbeit stellt einen neuro-symbolischen VLM-Agenten vor, der mithilfe des neuartigen Event Logic Tree (ELT)-Rahmenwerks semantische Zeitreihenereignisse in multivariaten Signalen auch mit wenigen oder keinen Trainingsdaten erkennt und dabei durch die Verknüpfung von Sprachbeschreibungen mit physikalischen Datenhalluzinationen vermeidet.

Sky Chenwei Wan, Tianjun Hou, Yifei Wang, Xiqing Chang, Aymeric Jan2026-03-13🤖 cs.LG

Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks

Die Arbeit beweist, dass die Normalisierung im Softmax-Mechanismus von Transformern zwingend zu sogenannten „Attention Sinks" führt, während nicht-normalisierte ReLU-Aufmerksamkeit dasselbe Trigger-Conditional-Aufgabenmuster ohne solche Ankerpunkte lösen kann.

Yuval Ran-Milo2026-03-13🤖 cs.LG

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

Die Arbeit stellt KEPo vor, eine neuartige Vergiftungsmethode, die die Sicherheitsanfälligkeit von Graph-basiertem Retrieval-Augmented Generation (GraphRAG) ausnutzt, indem sie durch das Erzeugen toxischer Ereignisse und gefälschter Wissensentwicklungswege den Wissensgraphen manipuliert, um Large Language Models zu schädlichen Antworten zu verleiten.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

Sharpness-Aware Minimization for Generalized Embedding Learning in Federated Recommendation

Der Artikel stellt FedRecGEL vor, einen neuen Rahmen für das föderierte Empfehlungssystem, der durch die Umformulierung des Problems als Multi-Task-Learning und den Einsatz von Sharpness-Aware Minimization stabile und generalisierte Item-Embeddings trotz heterogener lokaler Daten ermöglicht.

Fengyuan Yu, Xiaohua Feng, Yuyuan Li, Changwang Zhang, Jun Wang, Chaochao Chen2026-03-13🤖 cs.LG

LongFlow: Efficient KV Cache Compression for Reasoning M

Das Paper stellt LongFlow vor, eine effiziente Methode zur Komprimierung des KV-Caches für reasoning-Modelle, die durch eine kostengünstige Wichtigkeitsschätzung und einen fusionierten Kernel die Durchsatzleistung um das 11,8-fache steigert, während 80 % des Speichers eingespart werden und die Modellgenauigkeit erhalten bleibt.

Yi Su, Zhenxu Tian, Dan Qiao, Yuechi Zhou, Juntao Li, Min Zhang2026-03-13🤖 cs.LG

Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices

Die Arbeit stellt Gen-Fab vor, ein auf Pix2Pix basierendes generatives Modell, das mithilfe von latenten Rauschvektoren eine Vielzahl von hochauflösenden Vorhersagen für nanophotonische Fertigungsvariationen erzeugt und dabei sowohl in der Genauigkeit als auch in der Modellierung von Unsicherheiten bestehende deterministische und stochastische U-Net-Baselines übertrifft.

Rambod Azimi, Yuri Grinberg, Dan-Xia Xu, Odile Liboiron-Ladouceur2026-03-13🤖 cs.AI

CFD-HAR: User-controllable Privacy through Conditional Feature Disentanglement

Die vorgestellte Arbeit schlägt eine Methode zur nutzerkontrollierbaren Privatsphäre in der menschlichen Aktivitätserkennung (HAR) mittels bedingter Merkmalsentwirrung vor, die im Vergleich zu autoencoderbasierten Few-Shot-Ansätzen explizite Datenschutzkontrollen bietet, jedoch zeigt, dass keine der beiden Paradigmen allein die umfassenden Anforderungen zukünftiger IoT-Systeme erfüllt.

Alex Gn, Fan Li, S Kuniyilh, Ada Axan2026-03-13🤖 cs.LG

Simultaneous estimation of multiple discrete unimodal distributions under stochastic order constraints

Der Beitrag stellt eine Methode zur gleichzeitigen Schätzung mehrerer diskreter unimodaler Verteilungen unter Berücksichtigung stochastischer Ordnungsbeschränkungen vor, die durch Formulierung als gemischt-ganzzahliges konvexes quadratisches Optimierungsproblem insbesondere bei kleinen Stichprobengrößen die Genauigkeit im Vergleich zu bestehenden Verfahren verbessert.

Yasuhiro Yoshida, Noriyoshi Sukegawa, Jiro Iwanaga2026-03-13📊 stat

One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries

Die vorgestellte Arbeit stellt ein autonomes Multi-Modalitäts-Framework vor, das durch adaptive Orchestrierung spezialisierter Werkzeuge unter einer zentralen Supervision die Effizienz und Wirtschaftlichkeit multimodaler KI-Anwendungen signifikant steigert, ohne dabei die Genauigkeit zu beeinträchtigen.

Mayank Saini Arit Kumar Bishwas2026-03-13💬 cs.CL

Multi-Task Anti-Causal Learning for Reconstructing Urban Events from Residents' Reports

Die vorgestellte Arbeit stellt MTAC vor, ein Multi-Task-Lernframework, das durch die Ausnutzung von invarianter Kausalität über verschiedene Aufgaben hinweg die Rekonstruktion urbaner Ereignisse aus Bürgerberichten verbessert und auf Daten aus Manhattan und Newark eine signifikante Steigerung der Genauigkeit erzielt.

Liangkai Zhou, Susu Xu, Shuqi Zhong, Shan Lin2026-03-13🤖 cs.LG

CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time

Die Arbeit stellt CAETC vor, eine neue Methode zur Schätzung von kontrafaktischen Ergebnissen über die Zeit, die auf einem adversären Autoencoder basiert, um zeitabhängige Verzerrungen zu überwinden und die Genauigkeit in Bereichen wie der personalisierten Medizin zu verbessern.

Nghia D. Nguyen, Pablo Robles-Granda, Lav R. Varshney2026-03-13🤖 cs.LG

Survival Meets Classification: A Novel Framework for Early Risk Prediction Models of Chronic Diseases

Diese Studie stellt ein neuartiges Framework vor, das Überlebensanalysen mit Klassifikationstechniken kombiniert, um für fünf chronische Krankheiten präzise Risikovorhersagemodelle auf Basis von großen EMR-Daten zu entwickeln, die in ihrer Leistung etablierten Algorithmen wie LightGBM und XGBoost entsprechen oder diese übertreffen und durch klinisch validierte Erklärungen ergänzt werden.

Shaheer Ahmad Khan, Muhammad Usamah Shahid, Muddassar Farooq2026-03-13🤖 cs.LG

Hybrid Energy-Aware Reward Shaping: A Unified Lightweight Physics-Guided Methodology for Policy Optimization

Diese Studie stellt H-EARS vor, eine einheitliche, leichtgewichtige Methode, die potentialbasierte Reward-Shaping mit energiebewusster Aktionsregularisierung kombiniert, um die Konvergenz und Energieeffizienz von Deep Reinforcement Learning in kontinuierlichen Steuerungsaufgaben ohne vollständige physikalische Modelle zu verbessern.

Qijun Liao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Jue Yang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yiting Kang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Xinxin Zhao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yong Zhang (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China), Mingan Zhao (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China)2026-03-13🤖 cs.LG

AutoScout: Structured Optimization for Automating ML System Configuration

Das Paper stellt AutoScout vor, ein allgemeines System zur automatisierten Konfiguration von ML-Systemen, das durch eine hybride Optimierungsmethode und adaptive Priorisierung von Konfigurationsmerkmalen die Suchkosten senkt und im Vergleich zu manuell optimierten Einstellungen eine 2,7- bis 3,0-fache Trainingsbeschleunigung erreicht.

Jimmy Shong, Yuhan Ding, Yihan Jiang, Liheng Jing, Haonan Chen, Gaokai Zhang, Aditya Akella, Fan Lai2026-03-13🤖 cs.LG

Fractional Rotation, Full Potential? Investigating Performance and Convergence of Partial RoPE

Diese Studie zeigt, dass die Anwendung von Rotary Positional Embeddings (RoPE) auf nur einen kleinen Teil der Dimensionen (ca. 10 %) zu erheblichen Speichereinsparungen führt, ohne die Konvergenz oder Leistung im Vergleich zur vollständigen RoPE-Anwendung zu beeinträchtigen.

Mohammad Aflah Khan, Krishna P. Gummadi, Manish Gupta, Abhilasha Ravichander2026-03-13🤖 cs.LG

Shape-of-You: Fused Gromov-Wasserstein Optimal Transport for Semantic Correspondence in-the-Wild

Die Arbeit stellt "Shape-of-You" vor, ein Framework, das durch die Approximation des rechenintensiven Fused Gromov-Wasserstein-Optimal-Transport-Problems unter Nutzung eines 3D-Foundation-Modells und eines weichen Zielverlusts semantische Korrespondenzen in ungestützten Bildern ohne explizite geometrische Annotationen präzise und strukturell konsistent löst.

Jiin Im, Sisung Liu, Je Hyeong Hong2026-03-13🤖 cs.LG

Personalized Federated Learning via Gaussian Generative Modeling

Die Arbeit stellt pFedGM vor, eine personalisierte Methode für das Federated Learning, die auf Gauß'scher generativer Modellierung und einem dualen Fusionsrahmen basiert, um die Heterogenität der Client-Daten durch die Modellierung von Verteilungsstatistiken und eine Bayes'sche Inferenz effektiver zu bewältigen als bestehende Ansätze.

Peng Hu, Jianwei Ma2026-03-13🤖 cs.LG

Simple Recipe Works: Vision-Language-Action Models are Natural Continual Learners with Reinforcement Learning

Die Studie zeigt, dass einfaches sequenzielles Fine-Tuning mit LoRA für Vision-Language-Action-Modelle im kontinuierlichen Reinforcement Learning überraschend effektiv ist, da es durch die Synergie aus vortrainierten Modellen und on-policy RL katastrophales Vergessen vermeidet und dabei komplexere Methoden oft übertrifft.

Jiaheng Hu, Jay Shim, Chen Tang, Yoonchang Sung, Bo Liu, Peter Stone, Roberto Martin-Martin2026-03-13🤖 cs.LG

← Zurück Weiter →