cs Arbeiten | Gist.Science

Agentified Assessment of Logical Reasoning Agents

Die Arbeit stellt einen Framework für die robuste und überprüfbare Bewertung logischer Reasoning-Agenten vor, der in einer Fallstudie zeigt, dass ein Auto-Formalisierung-Agent für FOL-Reasoning auf Basis von Z3Py mit 86,70 % Genauigkeit einen Chain-of-Thought-Baseline (73,89 %) auf dem bereinigten FOLIO-Datensatz übertrifft.

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Required-edge Cycle Cover Problem: an ASP-Completeness Framework for Graph Problems and Puzzles

Diese Arbeit stellt das Required-edge Cycle Cover Problem (RCCP) als einen neuen ASP-Vollständigkeitsrahmen für Graphprobleme und Rätsel vor, der nicht nur die ASP-Vollständigkeit von Kakuro für die Ziffernmenge {1, 2, 3} nachweist und ein offenes Problem der MIT Hardness Group löst, sondern auch die ASP-Vollständigkeit zahlreicher weiterer Rätsel wie Chocona und Hinge beweist.

Kosuke Susukita, Junichi Teruyama2026-03-10💻 cs

Sharing is caring: Attestable and Trusted Workflows out of Distrustful Components

Das Paper stellt Mica vor, eine Architektur für vertrauliches Computing auf Basis von Arm CCA, die durch die Entkopplung von Vertraulichkeit und Vertrauen sowie die Einführung einer Policy-Sprache zur Attestierung von Kommunikationspfaden sichere Workflows über nicht vertrauenswürdige Komponenten hinweg ermöglicht.

Amir Al Sadi, Sina Abdollahi, Adrien Ghosn, Hamed Haddadi, Marios Kogias2026-03-10💻 cs

LDP-Slicing: Local Differential Privacy for Images via Randomized Bit-Plane Slicing

Die Arbeit stellt LDP-Slicing vor, ein effizientes, trainingsfreies Framework, das durch die Zerlegung von Bildern in Bit-Ebenen und eine optimierte Budgetverteilung den Einsatz von lokaler Differentialprivatsphäre für Bilddaten ermöglicht und dabei die Nutzbarkeit für nachgelagerte Aufgaben im Vergleich zu bestehenden Methoden erheblich verbessert.

Yuanming Cao, Chengqi Li, Wenbo He2026-03-10💻 cs

RISCBench: Benchmarking RISC-V Orchestration Efficiency in FPGA and FPGA-Like Computing Engines

Die Arbeit stellt RISCBench vor, einen Benchmark und eine Methodik zur Quantifizierung der Orchestrierungseffizienz von RISC-V-Kernen in heterogenen Systemen mittels der neu eingeführten Metrik „Sustained Instantaneous Throughput" (SIT), um die oft vernachlässigten Trade-offs bei Synchronisation und Datenresidenz über reine Spitzenleistungsmetriken hinaus zu bewerten.

Dave Ojika, Projjal Gupta, Preethi Budi + 2 more2026-03-10💻 cs

Converting Binary Floating-Point Numbers to Shortest Decimal Strings: An Experimental Review

Diese Studie bietet eine experimentelle Überprüfung von Algorithmen zur Konvertierung binärer Gleitkommazahlen in kürzeste Dezimalstrings, wobei neuere Methoden wie Schubfach und Dragonbox eine bis zu zehnfache Geschwindigkeitssteigerung gegenüber klassischen Ansätzen wie Dragon4 aufweisen, jedoch oft keine optimal kurzen Ausgaben liefern und Standardbibliotheken in Sprachen wie C++ und Swift deutlich ineffizienter sind.

Jaël Champagne Gareau, Daniel Lemire2026-03-10💻 cs

AI-Powered Multi-Stakeholder Ecosystems for Global Development: A Design Research Study on the GSI D-Hub Proof-of-Concept Platform

Diese Design-Research-Studie stellt die GSI D-Hub-Plattform vor, die mittels erklärbarer künstlicher Intelligenz und synthetischer Datenpipelines Informationsasymmetrien zwischen Akteuren der globalen Entwicklung reduziert und so vertrauenswürdige, datengestützte Ökosysteme für transparente Zusammenarbeit ermöglicht.

Muzakkiruddin Ahmed Mohammed, Adeeba Tarannum, Eileen Devereux Dailey + 3 more2026-03-10💻 cs

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Die Studie zeigt, dass die Anfälligkeit von Migranten aus dem subsaharischen Afrika für KI-gestützte Betrugsmaschen primär durch frühere Zielgruppenansprache bestimmt wird, während das Selbstvertrauen im Erkennen von KI-Inhalten und ein hohes Maß an Verifikationsbemühungen als wesentliche Schutzfaktoren wirken.

Deborah Oluwasanya2026-03-10💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Dieser Artikel stellt einen „Ethics-by-Design"-Ansatz vor, der durch eine dreistufige Gate-Struktur (Metrik, Governance, Ökologie) ethische Prinzipien in messbare, durchsetzbare Kontrollmechanismen für den gesamten KI-Lebenszyklus übersetzt und so eine praktische Verbindung zwischen philosophischen Normen und operativer Governance herstellt.

Jasper Kyle Catapang2026-03-10💻 cs

Causal Analysis of Author Demographics in Academic Peer Review

Diese Studie nutzt Kausalitätsanalysen, um nachzuweisen, dass Autoren aus Minderheiten, Frauen und Institutionen des Globalen Süden in akademischen Peer-Review-Prozessen signifikante Benachteiligungen erfahren, was die dringende Notwendigkeit von Fairness-Maßnahmen sowohl für traditionelle als auch KI-gestützte Begutachtungen unterstreicht.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan Gauch2026-03-10💻 cs

Performance Comparison of IBN orchestration using LLM and SLMs

Diese Arbeit stellt ein neuartiges Framework für die IBN-Orchestrierung in 5G- und 6G-Netzen vor, das eine hierarchische Multi-Agenten-Architektur nutzt und zeigt, dass Small Language Models (SLMs) im Vergleich zu Large Language Models (LLMs) bei gleicher Übersetzungspräzision die Gesamtabwicklungsgeschwindigkeit des IBN-Lebenszyklus um 20 % steigern können.

Wai Lwin Phone, Brahim El Boudani, Tasos Dagiuklas, Saptarshi Ghosh2026-03-10💻 cs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

Die Arbeit stellt den ObjChangeVR-Datensatz und ein entsprechendes Framework vor, das durch viewpoint-aware und zeitbasierte Abrufmechanismen sowie eine übergreifende Sichtweisen-Integration die Herausforderung der Erkennung von Objektzustandsänderungen in VR-Umgebungen aus kontinuierlichen Egocentric-Ansichten effektiv löst.

Shiyi Ding, Shaoen Wu, Ying Chen2026-03-10💻 cs

Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis

Die Studie stellt einen neuen Rahmen zur margin-konsistenten Deep Subtyping von invasivem Lungenadenokarzinom vor, der durch die Einführung einer Störungs-Verlässlichkeitsbewertung (Perturbation Fidelity) und attention-basierter Aggregation die Robustheit und Genauigkeit bei der Klassifizierung von Ganzschnittbildern signifikant verbessert und dabei hohe AUC-Werte sowie eine bemerkenswerte Generalisierbarkeit über verschiedene Institutionen hinweg demonstriert.

Meghdad Sabouri Rad (Vincent), Junze (Vincent), Huang, Mohammad Mehdi Hosseini, Rakesh Choudhary, Saverio J. Carello, Ola El-Zammar, Michel R. Nasr, Bardia Rodd2026-03-10💻 cs

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment

Das Paper stellt PaLMR vor, ein Framework, das durch eine wahrnehmungsorientierte Datenschicht und eine prozessbewusste Optimierungsstrategie die visuelle Glaubwürdigkeit von Multimodal Large Language Models verbessert, indem es nicht nur das Endergebnis, sondern auch den gesamten Denkprozess an die visuellen Beweise anpasst.

Yantao Li, Qiang Hui, Chenyang Yan, Kanzhi Cheng, Fang Zhao, Chao Tan, Huanling Gao, Jianbing Zhang, Kai Wang, Xinyu Dai, Shiguo Lian2026-03-10💻 cs

Digital Twin-Enabled Mobility-Aware Cooperative Caching in Vehicular Edge Computing

Die vorgestellte Arbeit schlägt ein Digital-Twin-gestütztes Framework namens DAPR vor, das asynchrones Federated Learning, ein GRU-VAE-Vorhersagemodell und Deep Reinforcement Learning kombiniert, um die Client-Auswahl, die Genauigkeit der Inhaltsvorhersage und die dynamische Ressourcenallokation in der kooperativen Caching von Fahrzeug-Edge-Computing zu optimieren und somit die Cache-Trefferquote zu erhöhen sowie die Übertragungsverzögerung zu verringern.

Jiahao Zeng, Zhenkui Shi, Chunpei Li, Mengkai Yan, Hongliang Zhang, Sihan Chen, Xiantao Hu, Xianxian Li2026-03-10💻 cs

A Parameter-efficient Convolutional Approach for Weed Detection in Multispectral Aerial Imagery

Die Studie stellt FCBNet vor, einen parameter-effizienten Faltungsansatz mit einem eingefrorenen ConvNeXt-Rückgrat und einem Feature-Correction-Block, der bei der Unkrautsegmentierung in multispektralen Luftbildern sowohl eine hohe Genauigkeit (über 85 % mIoU) als auch eine deutliche Reduktion der trainierbaren Parameter und des Rechenaufwands im Vergleich zu bestehenden Modellen erreicht.

Leo Thomas Ramos, Angel D. Sappa2026-03-10💻 cs

GameVerse: Can Vision-Language Models Learn from Video-based Reflection?

Das Paper stellt GameVerse vor, ein umfassendes Benchmark für Videospiele, das nachweist, dass Vision-Language-Modelle durch einen reflektierenden Lernansatz mit Videoanalysen von Fehlern und Tutorials ihre Spielstrategien verbessern können.

Kuan Zhang, Dongchen Liu, Qiyue Zhao, Jinkun Hou, Xinran Zhang, Qinlei Xie, Miao Liu, Yiming Li2026-03-10💻 cs

ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

Die Arbeit stellt ASMIL vor, ein einheitliches Framework für das multiple Instanzlernen in der Ganzschliffbildanalyse, das durch einen Anker-Modellansatz, eine normalisierte Sigmoid-Funktion und zufälliges Token-Dropping Instabilitäten, Überanpassung und übermäßige Konzentration der Aufmerksamkeit überwindet und damit die Leistungsfähigkeit bestehender Methoden signifikant steigert.

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Dieses Kapitel untersucht das Potenzial generativer KI, die Wissenschaftskompetenz im K-16+-Bildungsbereich zu stärken, indem es eine kohärente Architektur für Lehre, Lernen und Bewertung entwickelt, die sowohl die neuen Anforderungen an die Wissenschaftskompetenz in der KI-Ära als auch die damit verbundenen konzeptionellen und praktischen Herausforderungen adressiert.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam Biswas2026-03-10💻 cs

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting

Die Arbeit stellt Graph-of-Mark (GoM) vor, eine neuartige pixelbasierte visuelle Prompting-Technik, die durch das Überlagern von Szenengraphen auf Eingabebilder die räumliche Schlussfolgerung multimodaler Sprachmodelle signifikant verbessert und dabei die Genauigkeit bei Null-Shot-Aufgaben um bis zu 11 Prozentpunkte steigert.

Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro2026-03-10💻 cs

← Zurück Weiter →