cs papers | Gist.Science

Agentified Assessment of Logical Reasoning Agents

Dit artikel introduceert een reproduceerbaar en auditabel framework voor het beoordelen van logische redeneeragenten, waarbij een 'assessor-agent' wordt gebruikt om taken te beheren en fouten te registreren, en demonstreert dat een auto-formalisatie-agent voor eerste-orde logica op een gerepareerde FOLIO-dataset een significant hogere nauwkeurigheid bereikt dan een chain-of-thought-baseline.

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Required-edge Cycle Cover Problem: an ASP-Completeness Framework for Graph Problems and Puzzles

Dit paper introduceert het Required-edge Cycle Cover Problem (RCCP) als een ASP-compleetheidsframework voor grafproblemen en legpuzzels, waarmee de ASP-compleetheid van diverse puzzels zoals Kakuro en Chocona wordt bewezen en een open probleem van de MIT Hardness Group wordt opgelost.

Kosuke Susukita, Junichi Teruyama2026-03-10💻 cs

Sharing is caring: Attestable and Trusted Workflows out of Distrustful Components

Dit paper introduceert Mica, een confidential computing-architectuur die vertrouwelijkheid ontkoppelt van vertrouwen door via een beleidslanguage alle communicatiepaden tussen componenten te definiëren, te beperken en te verifiëren, waardoor gevoelige data veilig blijft in onbetrouwbare cloudomgevingen.

Amir Al Sadi, Sina Abdollahi, Adrien Ghosn, Hamed Haddadi, Marios Kogias2026-03-10💻 cs

LDP-Slicing: Local Differential Privacy for Images via Randomized Bit-Plane Slicing

Dit paper introduceert LDP-Slicing, een lichtgewicht framework dat lokale differentiaalse privacy voor beelden mogelijk maakt door pixelwaarden te decomponeren in bit-plannen, waardoor de gebruiksgraad voor downstream-taken aanzienlijk verbetert ten opzichte van bestaande methoden zonder trainingskosten.

Yuanming Cao, Chengqi Li, Wenbo He2026-03-10💻 cs

RISCBench: Benchmarking RISC-V Orchestration Efficiency in FPGA and FPGA-Like Computing Engines

Dit paper introduceert RISCBench, een benchmarksuite en de nieuwe SIT-maatstaf (Sustained Instantaneous Throughput) om de orchestrationsefficiëntie van RISC-V-kernen in heterogene FPGA-systemen te kwantificeren, waarbij de nadruk ligt op synchronisatie en dataresidentie in plaats van alleen piekprestaties.

Dave Ojika, Projjal Gupta, Preethi Budi + 2 more2026-03-10💻 cs

Converting Binary Floating-Point Numbers to Shortest Decimal Strings: An Experimental Review

Deze empirische studie vergelijkt algoritmen voor het converteren van binaire zwevende-kommagetallen naar decimale strings en toont aan dat moderne methoden zoals Schubfach en Dragonbox aanzienlijk sneller zijn dan oudere technieken, hoewel geen enkele onderzochte implementatie consistent de kortst mogelijke output genereert.

Jaël Champagne Gareau, Daniel Lemire2026-03-10💻 cs

AI-Powered Multi-Stakeholder Ecosystems for Global Development: A Design Research Study on the GSI D-Hub Proof-of-Concept Platform

Dit artikel presenteert het GSI D-Hub-platform, een door kunstmatige intelligentie aangedreven systeem dat via transparante en verklaarbare algoritmes de samenwerking tussen financiers, oplossingsproviders en implementatoren in de ontwikkelingssector verbetert door informatieasymmetrieën te verminderen en vertrouwen te creëren.

Muzakkiruddin Ahmed Mohammed, Adeeba Tarannum, Eileen Devereux Dailey + 3 more2026-03-10💻 cs

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Deze studie concludeert dat eerdere blootstelling aan targeting de sterkste indicator is voor kwetsbaarheid voor door AI mogelijk gemaakte oplichting onder migranten uit Sub-Sahara-Afrika, terwijl vertrouwen in het kunnen identificeren van AI-inhoud en een hoge verificatie-inspanning beschermende factoren vormen.

Deborah Oluwasanya2026-03-10💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Dit paper introduceert een ethiek-van-ontwerp besturingsarchitectuur die een drievoudige poortstructuur (metrisch, bestuurlijk en ecologisch) implementeert in de volledige AI-levenscyclus om ethische risico's om te zetten in afdwingbare en testbare controles die compatibel zijn met bestaande MLOps-pipelines en regelgeving zoals de EU AI Act.

Jasper Kyle Catapang2026-03-10💻 cs

Causal Analysis of Author Demographics in Academic Peer Review

Dit onderzoek toont aan dat auteurs van minderheidsgroepen, vrouwen en onderzoekers uit het Zuiden significant worden benadeeld in academische peer review, wat de dringende noodzaak onderstreept van rechtvaardigheidsinterventies in zowel traditionele als AI-gestuurde beoordelingsprocessen.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan Gauch2026-03-10💻 cs

Performance Comparison of IBN orchestration using LLM and SLMs

Dit paper introduceert een hiërarchisch multi-agent framework voor IBN-orkestratie in 5G/6G-netwerken dat aantoont dat Small Language Models (SLMs) een vergelijkbare vertaalkwaliteit bieden als Large Language Models (LLMs), maar de levenscyclus van het IBN met 20% versnellen.

Wai Lwin Phone, Brahim El Boudani, Tasos Dagiuklas, Saptarshi Ghosh2026-03-10💻 cs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

Dit artikel introduceert ObjChangeVR-Dataset en het ObjChangeVR-framework om objectstatusveranderingen in VR-omgevingen te analyseren vanuit continue egocentrische perspectieven, waarbij cross-view redenering en tijdsgebonden zoekopdrachten worden gebruikt om veranderingen te detecteren die plaatsvinden zonder directe gebruikersinteractie.

Shiyi Ding, Shaoen Wu, Ying Chen2026-03-10💻 cs

Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis

Deze studie introduceert een nieuw randconsistentie-framework met 'Perturbation Fidelity'-scoring voor het robuust subtyperen van invasieve longadenocarcinoom op basis van hele-slice-beelden, wat aanzienlijke verbeteringen in nauwkeurigheid en generalisatie oplevert ondanks beeldvervormingen en domeinverschuivingen.

Meghdad Sabouri Rad (Vincent), Junze (Vincent), Huang, Mohammad Mehdi Hosseini, Rakesh Choudhary, Saverio J. Carello, Ola El-Zammar, Michel R. Nasr, Bardia Rodd2026-03-10💻 cs

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment

Het paper introduceert PaLMR, een framework dat de redeneerprocessen van multimodale modellen verbetert door hallucinaties te verminderen en visuele trouw te waarborgen via een combinatie van perceptie-uitgelijnde data en een hiërarchische beloningsfunctie, wat leidt tot state-of-the-art resultaten op benchmarks zoals HallusionBench.

Yantao Li, Qiang Hui, Chenyang Yan, Kanzhi Cheng, Fang Zhao, Chao Tan, Huanling Gao, Jianbing Zhang, Kai Wang, Xinyu Dai, Shiguo Lian2026-03-10💻 cs

Digital Twin-Enabled Mobility-Aware Cooperative Caching in Vehicular Edge Computing

Dit artikel introduceert het DAPR-framework, dat digitale tweelingen, asynchrone federated learning en deep reinforcement learning combineert om de prestaties van voertuigedge-caching te optimaliseren door de clientselectie te verbeteren en de inhoudspredictie nauwkeuriger te maken.

Jiahao Zeng, Zhenkui Shi, Chunpei Li, Mengkai Yan, Hongliang Zhang, Sihan Chen, Xiantao Hu, Xianxian Li2026-03-10💻 cs

A Parameter-efficient Convolutional Approach for Weed Detection in Multispectral Aerial Imagery

Dit paper introduceert FCBNet, een parameter-efficiënt convolutioneel model met een bevroren ConvNeXt-ruggengraat en een Feature Correction Block dat op multispectrale luchtfoto's een hogere nauwkeurigheid en trainings-efficiëntie bereikt dan bestaande methoden voor onkruiddetectie.

Leo Thomas Ramos, Angel D. Sappa2026-03-10💻 cs

GameVerse: Can Vision-Language Models Learn from Video-based Reflection?

Dit paper introduceert GameVerse, een benchmark die aantoont dat Vision-Language-modellen hun spelstrategieën kunnen verbeteren door video-gebaseerde reflectie op fouten en experttutorials te combineren in een reflecteer-en-probeer-opnieuw-paradigma.

Kuan Zhang, Dongchen Liu, Qiyue Zhao, Jinkun Hou, Xinran Zhang, Qinlei Xie, Miao Liu, Yiming Li2026-03-10💻 cs

ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

Deze paper introduceert ASMIL, een nieuw raamwerk voor multiple instance learning dat door het gebruik van een ankermodel, een genormaliseerde sigmoid-functie en willekeurige token-dropping de instabiele attentiedynamiek, overfitting en te geconcentreerde verdelingen in de diagnose van hele slide-afbeeldingen effectief aanpakt en aanzienlijk betere prestaties levert dan bestaande methoden.

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Dit hoofdstuk onderzoekt hoe generatieve kunstmatige intelligentie kan fungeren als een katalysator voor coherentie in het onderwijs, de leerprocessen en de beoordeling van wetenschappelijke geletterdheid op K-16+ niveau, terwijl het ook de conceptuele en praktische uitdagingen en de noodzakelijke architectuur voor implementatie belicht.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam Biswas2026-03-10💻 cs

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting

Het paper introduceert Graph-of-Mark (GoM), een nieuwe pixel-level visuele prompting-techniek die scene graphs overlayt op afbeeldingen om de ruimtelijke redeneercapaciteiten van multimodale taalmodellen aanzienlijk te verbeteren door objectrelaties in plaats van geïsoleerde objecten te benadrukken.

Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro2026-03-10💻 cs

← Vorige Volgende →