cs.AI Arbeiten | Gist.Science

Automated Reinforcement Learning: An Overview

Dieser Artikel bietet einen Überblick über das automatisierte Reinforcement Learning (AutoRL), das verschiedene Komponenten wie MDP-Modellierung, Algorithmusauswahl und Hyperparameter-Optimierung automatisiert, und fasst dabei aktuelle Forschung, einschließlich LLM-basierter Techniken, sowie zukünftige Herausforderungen und Forschungsrichtungen zusammen.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

Diese Arbeit stellt ein erklärbares, unsicherheitsbewusstes Subsequenz-Modell vor, das die Klassifizierung astronomischer Zeitreihen mit vergleichbarer Leistung wie Black-Box-Methoden ermöglicht, indem es Datenunsicherheit direkt als Eingabe verarbeitet und Domain-Experten die Nachvollziehbarkeit der Vorhersagen sowie potenzielle neue Erkenntnisse für die theoretische Astrophysik bietet.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

A Survey of Large Language Models

Diese Arbeit bietet einen umfassenden Überblick über die Entwicklung, Schlüsseltechniken und Anwendungen von Large Language Models (LLMs), wobei sie sich insbesondere auf die Bereiche Pre-Training, Anpassung, Nutzung und Bewertung konzentriert und dabei verfügbare Ressourcen sowie zukünftige Herausforderungen diskutiert.

Wayne Xin Zhao, Kun Zhou, Junyi Li + 19 more2026-03-10💬 cs.CL

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Diese Übersichtsarbeit untersucht die Anwendung nutzungstheoretischer kognitiver Modelle in der Robotik, indem sie die Entwicklung von Verhaltensbasierter Robotik und kognitiven Architekturen hin zu wertebasierten Systemen für Entscheidungsfindung, Lernen und Interaktion in ein- und multi-agentischen Umgebungen analysiert und zukünftige Forschungsrichtungen sowie offene Probleme aufzeigt.

Qin Yang2026-03-10💻 cs

Online Dispatching and Routing for Automated Guided Vehicles in Pickup and Delivery Systems on Loop-Based Graphs

Die Autoren stellen einen effizienten, loop-basierten Algorithmus für das Online-Dispatching und Routing von fahrerlosen Transportsystemen (AGVs) in Kreisgraphen vor, der in Experimenten mit realen und theoretischen Instanzen entweder bessere Ergebnisse oder gleichwertige Lösungen in kürzerer Rechenzeit im Vergleich zu exakten Methoden, Greedy-Heuristiken und Metaheuristiken liefert.

Louis Stubbe, Jens Goemaere, Jan Goedgebeur2026-03-10💻 cs

Agent-OM: Leveraging LLM Agents for Ontology Matching

Die Studie stellt Agent-OM vor, ein neuartiges Framework für das Ontologie-Matching, das zwei Siamese-Agenten und LLM-Tools nutzt, um bei komplexen und Few-Shot-Aufgaben signifikante Verbesserungen gegenüber bestehenden Systemen zu erzielen.

Zhangcheng Qiang, Weiqing Wang, Kerry Taylor2026-03-10💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dieser Übersichtsartikel bietet eine maschinelle Lernperspektive auf den Computerized Adaptive Testing (CAT), indem er die Integration von ML-Techniken in Messmodelle, Fragenauswahl, Itembank-Konstruktion und Teststeuerung analysiert, um robuste, faire und effiziente adaptive Testsysteme zu entwickeln.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

Die Arbeit stellt FEX vor, ein neuartiges Framework, das attributionsbasierte Erklärungen durch Wahrscheinlichkeitsverteilungen und Policy-Gradient-Optimierung ermöglicht, um die Erklärungszeit um über 97 % und den Speicherverbrauch um 70 % im Vergleich zu herkömmlichen modellunabhängigen Ansätzen zu reduzieren, ohne dabei die Qualität oder allgemeine Anwendbarkeit zu beeinträchtigen.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Diese Arbeit identifiziert und analysiert eine unerwartete „Korruptionsphase" während des Few-Shot-Fine-Tunings von Diffusionsmodellen, die durch eine verengte Lernverteilung verursacht wird, und schlägt vor, Bayesianische Neuronale Netze zur impliziten Verbreiterung dieser Verteilung einzusetzen, um die Bildqualität und Vielfalt zu verbessern, ohne zusätzliche Inferenzkosten zu verursachen.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

LAMBDA ist ein neuartiges, quelloffenes und code-freies Multi-Agenten-System, das auf großen Sprachmodellen basiert und durch die Zusammenarbeit eines Programmier- und eines Prüfer-Agenten sowie die Möglichkeit zur menschlichen Eingriffnahme und Integration externer Algorithmen Datenanalysen für Nutzer unterschiedlicher Hintergründe zugänglicher und effizienter macht.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Die Arbeit stellt OTAD vor, ein neuartiges zweistufiges Verteidigungsmodell, das die Vorteile von adversarialem Training und Lipschitz-Netzen durch die Nutzung optimaler Transporttheorie und konvexer Integration vereint, um Deep-Learning-Systeme sowohl präzise als auch lokal Lipschitz-stetig und damit robust gegenüber unbekannten Angriffen zu machen.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Diese Arbeit schlägt einen effizienten Annealed Importance Sampling-Ansatz zur Verbesserung des Variational Learning von Gaussian Process Latent Variable Models vor, der durch eine sequenzielle Transformation der Posterior-Verteilung und eine Reparameterisierung des ELBO robustere Konvergenz und engere Variationsgrenzen als bestehende Methoden erreicht.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Diese Arbeit stellt das multimodale System MLVAS vor, das durch die Kombination von Videostroboskopie und Audioanalyse sowie fortschrittlicher Segmentierung und Merkmalsextraktion eine objektive, assistierte Diagnose der Stimmlippenlähmung ermöglicht.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Diese Arbeit untersucht das transformative Potenzial künstlicher Intelligenz zur Automatisierung und Optimierung der Testfallgenerierung und -validierung, wobei sie sowohl die gesteigerte Effizienz und Abdeckung als auch die Herausforderungen wie Datenqualität und die Balance zwischen Automatisierung und menschlicher Aufsicht beleuchtet.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Reconsidering the energy efficiency of spiking neural networks

Diese Arbeit widerlegt die vereinfachte Annahme der überlegenen Energieeffizienz von Spiking Neural Networks durch eine rigorose Neubewertung, die Datenbewegungskosten berücksichtigt, und identifiziert spezifische Betriebsbedingungen, unter denen SNNs gegenüber äquivalenten Quantisierten Neuronalen Netzen tatsächlich effizienter sind und die Akkulaufzeit von Geräten wie Smartwatches nahezu verdoppeln können.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Diese Arbeit stellt ein neuartiges Modell gekoppelter Oszillatoren (CON) vor, das durch die Kombination von Lagrange-Struktur, globaler Input-to-State-Stabilität und einer invertierbaren Abbildung zwischen Eingabe und latenter Kraft effiziente, modellbasierte Regelung im latenten Raum für physikalische Systeme ermöglicht, wie am Beispiel eines Soft-Roboters demonstriert wird.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Die Arbeit stellt BNEM vor, einen auf Bootstrapping und Noised Energy Matching basierenden Boltzmann-Sampler, der effizient und robust IID-Stichproben aus Energiefunktionen generiert und dabei den Stand der Technik in Bezug auf Leistung und Stabilität übertrifft.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Improving Visual Object Tracking through Visual Prompting

Die Arbeit stellt PiVOT vor, einen neuen Visual-Prompting-Mechanismus für das generische Objekttracking, der einen vortrainierten Fundamentmodell (CLIP) nutzt, um Online-Visual-Prompts automatisch zu generieren und zu verfeinern, wodurch der Tracker durch kontrastive Führung Störobjekte effektiv unterdrücken und die Verfolgungsleistung verbessern kann.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Die Arbeit stellt ein kontinuierliches Zeit-Modell auf Basis von neuronalen Verzögerungsdifferentialgleichungen vor, das mithilfe des Mori-Zwanzig-Formalismus und des Adjungierten-Verfahrens nicht-Markowsche Dynamiken aus teilweise beobachtbaren Daten lernt und dabei bestehende Methoden wie LSTMs und ANODEs übertrifft.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

Die Arbeit stellt Puppet-CNN vor, ein Framework, das die Parameter von Faltungsschichten als Zustände eines durch neuronale gewöhnliche Differentialgleichungen gesteuerten kontinuierlichen dynamischen Systems modelliert, wodurch eine eingabeadaptive Berechnung ermöglicht und die Anzahl der gespeicherten trainierbaren Parameter erheblich reduziert wird.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

← Zurück Weiter →