cs.AI Arbeiten | Gist.Science

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed ist ein in Rust implementiertes, produktionsreifes System, das durch statische Token-Lookups und Zero-Copy-Serialisierung Echtzeit-Text-Embeddings mit einer Latenz von 1,12 ms und 50.000 Anfragen pro Sekunde ermöglicht, wobei es bei Deduplizierungs- und Ähnlichkeitsaufgaben eine hohe Genauigkeit erreicht, jedoch bei komplexeren Klassifizierungsaufgaben hinter Transformer-basierten Modellen zurückbleibt.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Vectorized Online POMDP Planning

Das Paper stellt VOPP vor, einen vektorisierten Online-POMDP-Planer, der durch die Umwandlung aller Planungsdatenstrukturen in Tensoren und die vollständige Vektorisierung der Berechnungen massive Parallelisierung ohne Synchronisationsengpässe ermöglicht und damit sowohl effizientere Lösungen als auch eine um den Faktor 1000 reduzierte Planungsbudget-Nutzung im Vergleich zu bestehenden Solvern erreicht.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Die vorgestellte Arbeit schlägt einen forensischen Ansatz zur Erkennung von KI-generierten Bildern vor, der auf der Analyse des „Diffusion Snap-Back"-Verhaltens basiert, bei dem die Rekonstruktion eines Bildes durch ein Diffusionsmodell genutzt wird, um mit einer hohen Genauigkeit von 0,993 AUROC zwischen echten und synthetischen Bildern zu unterscheiden.

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Diese Studie vergleicht die interpretierbare ANFIS-FBCSP-PSO-Methode mit dem Deep-Learning-Modell EEGNet zur Motor-Imagery-EEG-Klassifizierung und zeigt, dass das Fuzzy-Modell bei innerhalb-subjektiven Tests überlegen ist, während EEGNet eine bessere Generalisierung über verschiedene Probanden hinweg bietet, was eine gezielte Auswahl des Systems je nach Anforderung an Interpretierbarkeit oder Robustheit ermöglicht.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Diese Arbeit stellt ein System für vernetzte Mixture-of-Experts (NMoE) im mobilen Edge-Computing vor, das durch eine effiziente, datenschutzkonforme Federated-Learning-Strategie die Herausforderungen beim Training großer KI-Modelle auf ressourcenbeschränkten Endgeräten adressiert.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Die Arbeit stellt FATE vor, eine neue Benchmark-Serie für formale Algebra, die LLMs vor extrem schwierige Forschungsprobleme stellt und dabei massive Leistungslücken sowie spezifische Fehlermuster bei der Formalisierung aufzeigt.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

Die Arbeit stellt HatePrototypes vor, interpretierbare und übertragbare Vektordarstellungen, die eine effiziente Erkennung sowohl von expliziter als auch von impliziter Hassrede ermöglichen, ohne wiederholtes Fine-Tuning zu erfordern.

Irina Proskurina, Marc-Antoine Carpentier, Julien Velcin2026-03-10💬 cs.CL

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Das Paper stellt LAMP vor, ein Framework für sprachaugmentiertes Multi-Agenten-Reinforcement-Learning, das durch eine „Denken-Sprechen-Entscheiden"-Pipeline numerische Daten mit sprachlicher Analyse verbindet und in Wirtschaftssimulationen signifikant bessere Ergebnisse als herkömmliche MARL- oder reine LLM-Ansätze erzielt.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

Der Artikel stellt UnfoldLDM vor, ein Deep-Unfolding-Framework, das durch die Integration eines latenten Diffusionsmodells und spezieller Module zur Schätzung von Degradationen sowie zur Wiederherstellung von Hochfrequenzdetails Blind Image Restoration verbessert.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Stable Multi-Drone GNSS Tracking System for Marine Robots

Diese Arbeit stellt ein stabiles, Echtzeit-Tracking-System für Marine-Roboter vor, das mithilfe eines Schwarmes von Drohnen, visueller Erkennung, GNSS-Triangulation und eines erweiterten Kalman-Filters die Positionsbestimmung unter der Wasseroberfläche ermöglicht, wo GNSS-Signale nicht verfügbar sind.

Shuo Wen, Edwin Meriaux, Mariana Sosa Guzmán, Zhizun Wang, Junming Shi, Gregory Dudek2026-03-10💻 cs

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Diese Arbeit verbessert die Zuverlässigkeit der SmoothLLM-Abwehr gegen Jailbreaking-Angriffe, indem sie eine strengere Annahme durch ein realistischeres probabilistisches (k, $\varepsilon$ )-Instabilitäts-Framework ersetzt, das auf empirischen Angriffsmodellen basiert und praktikable Sicherheitsgarantien für den Einsatz von LLMs liefert.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Die Arbeit stellt Yo'City vor, ein neuartiges agentic Framework, das mithilfe von Large Language Models eine personalisierte, hierarchisch geplante und unendlich erweiterbare Generierung realistischer 3D-Stadtlandschaften ermöglicht und dabei bestehende Methoden in allen Bewertungskriterien übertrifft.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

Enhancing low energy reconstruction and classification in KM3NeT/ORCA with transformers

Diese Studie verbessert die Rekonstruktion und Klassifizierung von Neutrinos im KM3NeT/ORCA-Teleskop durch den Einsatz von Transformern, die mittels physik- und detektorinspirierter Attention-Masks das Verständnis für das Detektordesign sowie die Neutrinophysik ermöglichen und zudem eine effiziente Feinabstimmung zwischen verschiedenen Konfigurationen unterstützen.

Iván Mozún Mateo (on behalf of the KM3NeT collaboration)2026-03-10🔭 astro-ph

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Diese Studie stellt eine automatisierte Pipeline zur Generierung großskaliger, psychologisch fundierter Multi-Turn-Jailbreak-Datensätze vor und zeigt, dass LLMs der GPT-Familie durch kontextbasierte Manipulationen erheblich anfälliger sind als widerstandsfähigere Modelle wie Gemini 2.5 Flash und Claude 3 Haiku.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Computing Evolutionarily Stable Strategies in Multiplayer Games

Die Autoren stellen einen Algorithmus vor, der es ermöglicht, alle evolutionär stabilen Strategien in nichtentarteten Normalformspielen mit drei oder mehr Spielern zu berechnen.

Sam Ganzfried2026-03-10📈 econ

RadDiff: Retrieval-Augmented Denoising Diffusion for Protein Inverse Folding

Die Arbeit stellt RadDiff vor, eine neuartige Methode für das inverse Proteinfalten, die durch eine retrieval-augmentierte Denoising-Diffusion externe Proteinwissen effizient integriert und damit bestehende Ansätze in Bezug auf Sequenzwiederherstellungsrate und Skalierbarkeit deutlich übertrifft.

Jin Han, Tianfan Fu, Wu-Jun Li2026-03-10💻 cs

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Die Studie stellt ForamDeepSlice vor, ein hochpräzises Deep-Learning-Framework, das auf einem Ensemble von CNN-Architekturen basiert und eine Genauigkeit von 95,64 % bei der automatisierten Klassifizierung von Foraminiferen-Arten aus 2D-Mikro-CT-Schnitten erreicht, wodurch ein neuer Benchmark für die KI-gestützte mikropaläontologische Identifizierung gesetzt wird.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Diese Arbeit stellt einen Ansatz vor, der einen kausalen Foundation-Modell in ein präskriptives Wartungsframework integriert, um durch die Simulation von „Was-wäre-wenn"-Szenarien auf Produktionslinien die Ursachen von Ausfällen zu identifizieren und die Gesamtanlageneffektivität (OEE) durch datengestützte Handlungsempfehlungen zu optimieren.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

Die Arbeit stellt AltNet vor, eine Methode, die das Dilemma zwischen Plastizität und Stabilität im Reinforcement Learning durch den Einsatz von zwei sich abwechselnden Twin-Netzwerken löst, wodurch Plastizität ohne die für Sicherheitsanwendungen kritischen Leistungseinbußen bei Parameterrücksetzungen wiederhergestellt wird.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

← Zurück Weiter →