cs.AI Arbeiten | Gist.Science

RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators

Das Paper stellt RedFuser vor, ein automatisches Framework, das mithilfe einer formalen theoretischen Methode kaskadierte Reduktionsoperationen in AI-Beschleunigern effizient fusioniert und damit im Vergleich zu aktuellen Compilern Geschwindigkeitssteigerungen von bis zu 5-fach erzielt.

Xinsheng Tang, Yangcheng Li, Nan Wang, Zhiyi Shu, Xingyu Ling, Junna Xing, Peng Zhou, Qiang Liu2026-03-12🤖 cs.AI

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Diese Arbeit stellt ein Governance- und Evaluierungsrahmenwerk für deterministische, regelbasierte klinische Entscheidungsunterstützungssysteme bei der empirischen Antibiotikaverschreibung vor, das Transparenz, Auditierbarkeit und konservatives Verhalten durch explizite Abstinenzregeln und synthetische Validierungsszenarien sicherstellt.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Der Artikel analysiert die rechtlichen Herausforderungen der Identifizierung und Zurechnung von Haftung für autonome KI-Agenten und schlägt als Lösung das Konzept der „Algorithmischen Gesellschaft" (A-corp) vor, eine rechtliche Fiktion, die menschliches Eigentum mit KI-Management verbindet, um sowohl die Zuordnung zu menschlichen Prinzipalen als auch die stabile rechtliche Einordnung der KI-Entitäten selbst zu gewährleisten.

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

The DMA Streaming Framework: Kernel-Level Buffer Orchestration for High-Performance AI Data Paths

Die Arbeit stellt dmaplane vor, ein Linux-Kernel-Modul, das durch explizite Puffer-Orchestrierung, NUMA-bewusste Verwaltung und RDMA-Integration eine stabile Schnittstelle für hochperformante, sicherheitskritische Datenpfade in KI-Anwendungen bereitstellt.

Marco Graziano2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Diese Studie präsentiert eine umfassende Benchmark- und Deployment-Analyse der LLM-Inferenz auf AMD Instinct MI325X-GPUs, die zeigt, dass architekturspezifische Optimierungen wie die selektive Nutzung des AITER-Runtimes und angepasste Blockgrößen entscheidend für die Leistung sind, während alle getesteten Modelle bei hohen Parallelitätsgraden an eine Speicherbandbreitenbegrenzung stoßen, aber dennoch eine hohe Zuverlässigkeit aufweisen.

Athos Georgiou2026-03-12🤖 cs.AI

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Die Arbeit stellt HTM-EAR vor, ein hierarchisches Tiered-Memory-System mit hybrider Routing-Strategie und bewusster Verdrängung, das unter Sättigungsbedingungen durch den Erhalt wichtiger Informationen und gezieltes Vergessen veralteter Fakten die Abfragepräzision signifikant verbessert.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Diese Arbeit stellt ein umfassendes Benchmark-Framework vor, das den Fortschritt von Graph-Grundmodellen durch eine neuartige Zwei-Achsen-Evaluierung von Themen- und Formatverschiebungen über den gesamten Lernprozess hinweg systematisch bewertet und dabei neue empirische Erkenntnisse für zukünftige Forschung liefert.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Targeted Bit-Flip Attacks on LLM-Based Agents

Die Studie stellt Flip-Agent vor, das erste gezielte Bit-Flip-Angriffsframework für LLM-basierte Agenten, das durch Manipulation von Hardware-Fehlern sowohl Endausgaben als auch Tool-Aufrufe in realen Szenarien effektiv sabotiert.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien Chang2026-03-12🤖 cs.AI

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition

Die Arbeit stellt das AMB-DSGDN-Modell vor, das durch adaptive Modality-Balancing-Mechanismen und einen differentiellen Graph-Attention-Ansatz redundante Signale filtert und dominante Modalitäten ausgleicht, um die multimodale Emotionserkennung in Dialogen zu verbessern.

Yunsheng Wang, Yuntao Shou, Yilong Tan, Wei Ai, Tao Meng, Keqin Li2026-03-12🤖 cs.AI

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Die Studie zeigt, dass die Evaluierungsformate (z. B. Multiple-Choice vs. offen) einen größeren Einfluss auf gemessene Sicherheitswerte haben als die Scaffolding-Architekturen selbst, was universelle Sicherheitsaussagen unmöglich macht und eine kontextspezifische Prüfung pro Modell und Konfiguration erfordert.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Die vorgeschlagene Methode zur kontinuierlichen Lernfähigkeit in der menschlichen Aktivitätserkennung nutzt eine parametereffiziente, kanalweise gated Modulation eingefrorener vortrainierter Merkmale, um durch selektive Skalierung statt neuer Merkmalsgenerierung sowohl Stabilität gegen katastrophales Vergessen als auch Plastizität für neue Subjekte zu gewährleisten.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Die Studie stellt fünf Prompt-Engineering-Strategien vor, um Halluzinationen in industriellen LLM-Anwendungen zu reduzieren, und zeigt, dass insbesondere die „Enhanced Data Registry"-Methode (M4) über 100 Durchläufe hinweg konsistent die besten Ergebnisse liefert, während eine überarbeitete Version von M2 die größte relative Verbesserung aufweist.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Die Arbeit stellt XSAM vor, eine verbesserte und effiziente Implementierung von Sharpness-Aware Minimization, die durch eine intuitivere Interpretation des Gradienten und eine explizite Richtungsbestimmung des Maximums die Generalisierungsfähigkeit von neuronalen Netzen über bestehende Methoden hinaus optimiert.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Das Paper stellt InFusionLayer vor, ein Open-Source-Python-Tool, das auf Kombinatorischer Fusionsanalyse (CFA) basiert, um durch die Integration von Rang-Score-Charakteristik und kognitiver Diversität Ensemble-Methoden für überwachte und unüberwachte Klassifizierungsprobleme in gängigen Machine-Learning-Frameworks zu ermöglichen.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Die Arbeit stellt FlowSem-MAE vor, einen tabellenbasierten Masked Autoencoder, der durch die Berücksichtigung protokollspezifischer Feldsemantik und die Vermeidung von Induktionsverzerrungen bei der Verschlüsselungstraffik-Klassifizierung den aktuellen Stand der Technik übertrifft und dabei deutlich weniger gelabelte Daten benötigt.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Training Language Models via Neural Cellular Automata

Die Studie zeigt, dass das Vortraining von Sprachmodellen auf synthetischen, nicht-sprachlichen Daten aus neuronalen zellulären Automaten die Leistung und Konvergenzgeschwindigkeit im Vergleich zu herkömmlichen Textdaten verbessert und einen effizienteren Weg zu intelligenten Modellen durch vollständig synthetisches Pre-Training eröffnet.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Diese Arbeit stellt einen agenten Rahmen für künstliche Intelligenz-Rechnungen (AIBOMs) vor, der statische Software-Bills-of-Materials durch autonome Multi-Agenten-Systeme in dynamische, kontextbewusste Nachweisartefakte erweitert, um Reproduzierbarkeit und Schwachstellenbewertung unter sich ändernden Laufzeitbedingungen zu verbessern.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Das Paper stellt NabaOS vor, ein leichtgewichtiges Verifizierungsframework, das auf der indischen Erkenntnistheorie Nyaya Shastra basiert und durch HMAC-signierte Tool-Empfangsbestätigungen in Echtzeit Halluzinationen von KI-Agenten mit minimalem Latenzüberhead erkennt, wodurch es die Unpraktikabilität kryptografischer Zero-Knowledge-Beweise für interaktive Anwendungen überwindet.

Abhinaba Basu2026-03-12🤖 cs.AI

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Diese Positionspapier betrachtet Multi-Agenten-Speicher als Computer-Architekturproblem, schlägt eine dreischichtige Speicherhierarchie vor und identifiziert die Konsistenz des Multi-Agenten-Speichers als die dringendste offene Herausforderung für zuverlässige und skalierbare Systeme.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen Zhao2026-03-12🤖 cs.AI

The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification

Diese Arbeit stellt den Epistemischen Unterstützungs-Punkt-Filter (ESPF) als den optimalen, evidenzbasierten Filter vor, der Jaynes' Maximum-Entropie-Prinzip mit Popper's Falsifikation verbindet, um die worst-case epistemische Unwissenheit zu minimieren und dabei Bayessche Ansätze durch eine possibilistische Minimax-Optimierung zu übertreffen.

Moriba Kemessia Jah2026-03-12🔢 math

← Zurück Weiter →