A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Diese Arbeit stellt ein Governance- und Evaluierungsrahmenwerk für deterministische, regelbasierte klinische Entscheidungsunterstützungssysteme bei der empirischen Antibiotikaverschreibung vor, das Transparenz, Auditierbarkeit und konservatives Verhalten durch explizite Abstinenzregeln und synthetische Validierungsszenarien sicherstellt.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Der Artikel analysiert die rechtlichen Herausforderungen der Identifizierung und Zurechnung von Haftung für autonome KI-Agenten und schlägt als Lösung das Konzept der „Algorithmischen Gesellschaft" (A-corp) vor, eine rechtliche Fiktion, die menschliches Eigentum mit KI-Management verbindet, um sowohl die Zuordnung zu menschlichen Prinzipalen als auch die stabile rechtliche Einordnung der KI-Entitäten selbst zu gewährleisten.

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Diese Studie präsentiert eine umfassende Benchmark- und Deployment-Analyse der LLM-Inferenz auf AMD Instinct MI325X-GPUs, die zeigt, dass architekturspezifische Optimierungen wie die selektive Nutzung des AITER-Runtimes und angepasste Blockgrößen entscheidend für die Leistung sind, während alle getesteten Modelle bei hohen Parallelitätsgraden an eine Speicherbandbreitenbegrenzung stoßen, aber dennoch eine hohe Zuverlässigkeit aufweisen.

Athos Georgiou2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Diese Arbeit stellt ein umfassendes Benchmark-Framework vor, das den Fortschritt von Graph-Grundmodellen durch eine neuartige Zwei-Achsen-Evaluierung von Themen- und Formatverschiebungen über den gesamten Lernprozess hinweg systematisch bewertet und dabei neue empirische Erkenntnisse für zukünftige Forschung liefert.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Gated Adaptation for Continual Learning in Human Activity Recognition

Die vorgeschlagene Methode zur kontinuierlichen Lernfähigkeit in der menschlichen Aktivitätserkennung nutzt eine parametereffiziente, kanalweise gated Modulation eingefrorener vortrainierter Merkmale, um durch selektive Skalierung statt neuer Merkmalsgenerierung sowohl Stabilität gegen katastrophales Vergessen als auch Plastizität für neue Subjekte zu gewährleisten.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Die Studie stellt fünf Prompt-Engineering-Strategien vor, um Halluzinationen in industriellen LLM-Anwendungen zu reduzieren, und zeigt, dass insbesondere die „Enhanced Data Registry"-Methode (M4) über 100 Durchläufe hinweg konsistent die besten Ergebnisse liefert, während eine überarbeitete Version von M2 die größte relative Verbesserung aufweist.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Diese Arbeit stellt einen agenten Rahmen für künstliche Intelligenz-Rechnungen (AIBOMs) vor, der statische Software-Bills-of-Materials durch autonome Multi-Agenten-Systeme in dynamische, kontextbewusste Nachweisartefakte erweitert, um Reproduzierbarkeit und Schwachstellenbewertung unter sich ändernden Laufzeitbedingungen zu verbessern.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Das Paper stellt NabaOS vor, ein leichtgewichtiges Verifizierungsframework, das auf der indischen Erkenntnistheorie Nyaya Shastra basiert und durch HMAC-signierte Tool-Empfangsbestätigungen in Echtzeit Halluzinationen von KI-Agenten mit minimalem Latenzüberhead erkennt, wodurch es die Unpraktikabilität kryptografischer Zero-Knowledge-Beweise für interaktive Anwendungen überwindet.

Abhinaba Basu2026-03-12🤖 cs.AI