cs papers | Gist.Science

DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

Het paper introduceert DivCon, een aanpak die complexe tekst-naar-beeldgeneratie verbetert door de taak op te splitsen in subtaken voor ruimtelijk redeneren en objectopbouw, waardoor lichtere modellen betere prestaties leveren dan eerdere methoden op benchmarks zoals HRS en NSR-1K.

Yuhao Jia, Wenhan Tan2026-03-10💻 cs

Deepfake Generation and Detection: A Benchmark and Survey

Dit paper biedt een uitgebreid overzicht en benchmark van de nieuwste ontwikkelingen in deepfake-generatie en -detectie, waarbij het de definities, datasets, methoden en toekomstige uitdagingen op dit gebied systematisch analyseert.

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Weighted Reservoir Sampling With Replacement from Data Streams

Dit artikel presenteert een nieuwe, efficiënte methode voor gewogen reservoirsampling met vervanging van datastromen die in één doorloop een representatieve steekproef genereert zonder post-processing, waarvan de correctheid formeel is bewezen en de prestaties experimenteel zijn gevalideerd.

Adriano Meligrana, Adriano Fazzone2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

De auteurs introduceren drie uitdagende testsets genaamd Hadrian, Eclipse en ND-Twins om zwakke punten in bestaande gezichtsherkenningmodellen te onthullen door te focussen op variaties in gezichtskenmerken en op elkaar lijkende personen, zonder de beeldkwaliteit kunstmatig te verlagen.

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

RDM: Recurrent Diffusion Model for Human Motion Generation

Dit paper introduceert RDM, een recurrente diffusiemodel dat Normalizing Flows gebruikt om menselijke bewegingen efficiënt en langdurig te genereren op basis van tekst, zonder de hoge rekenkosten van volledige denoising-stappen.

Mirgahney Mohamed, Harry Jake Cunningham, Marc P. Deisenroth, Lourdes Agapito2026-03-10💻 cs

Influence-Based Reward Modulation for Implicit Communication in Human-Robot Interaction

Dit artikel introduceert een methode die Transfer Entropy gebruikt om de invloed tussen agenten te moduleren via beloning, waardoor robots in mens-robotinteracties effectief impliciete communicatie kunnen ontwikkelen zonder expliciete intentiemodellering.

Haoyang Jiang, Elizabeth A. Croft, Michael G. Burke2026-03-10💻 cs

On Polynomial-Time Decidability of k-Negations Fragments of First-Order Theories

Dit artikel introduceert een generiek raamwerk dat voldoende voorwaarden biedt voor het garanderen van polynomiale tijd-beslisbaarheid voor fragmenten van eerste-orde theorieën met een vast aantal negaties, en past dit toe om te bewijzen dat de fragmenten met een vast aantal negaties van zwakke Presburger-aritmetiek, zwakke lineaire reële aritmetiek en een beperkte versie van Presburger-aritmetiek in polynomiale tijd beslisbaar zijn.

Christoph Haase, Alessio Mansutti, Amaury Pouly2026-03-10💻 cs

MORCoRA: Multi-Objective Refactoring Recommendation Considering Review Availability

MORCoRA is een multi-objectieve zoektechniek die refactoringsuggesties genereert die niet alleen de codekwaliteit verbeteren, maar ook rekening houden met de beschikbaarheid van deskundige reviewers om een snelle goedkeuring te waarborgen.

Lei Chen, Shinpei Hayashi2026-03-10💻 cs

A 1.6-fJ/Spike Subthreshold Analog Spiking Neuron in 28 nm CMOS

Dit artikel presenteert een energiezuinige analoge spiking-neuron in 28 nm CMOS-technologie die slechts 1,61 fJ per spike verbruikt en, gecombineerd met een gekwantiseerd spiking-neuraal netwerk, een nauwkeurigheid van 82,5% bereikt op de MNIST-dataset, wat de potentie aantoont voor hoogpresterende embedded machine learning-toepassingen.

Marwan Besrour, Takwa Omrani, Jacob Lavoie, Gabriel Martin-Hardy, Esmaeil Ranjbar Koleibi, Jeremy Menard, Konin Koua, Philippe Marcoux, Mounir Boukadoum, Rejean Fontaine2026-03-10💻 cs

Life Histories of Taboo Knowledge Artifacts

Dit gemengde methodologische onderzoek analyseert de levensgeschiedenis van Wikipedia-artikelen over taboe-onderwerpen en identificeert zes thema's die aantonen dat dergelijke kennisartefacten gedijen door veerkrachtig leiderschap, betrokken organisaties en emergente governance ondanks conflicten en beperkte identificeerbaarheid.

Kaylea Champion, Benjamin Mako Hill2026-03-10💻 cs

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Dit paper introduceert MLVAS, een multimodaal systeem dat audio- en videostroboscopische data combineert om automatische segmentatie, kenmerkextractie en objectieve visualisatie te bieden voor de ondersteunde diagnose van stembandverlamming.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Dit paper onderzoekt hoe kunstmatige intelligentie de softwaretestprocessen transformeert door geautomatiseerde testcasegenereering en validatie mogelijk te maken, wat leidt tot hogere efficiëntie, nauwkeurigheid en schaalbaarheid, terwijl het ook de uitdagingen rondom datakwaliteit, transparantie en de balans tussen automatisering en menselijk toezicht adresseert.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Safe Navigation of Bipedal Robots via Koopman Operator-Based Model Predictive Control

Deze paper presenteert een veilig navigatiekader voor bipedale robots dat een door deep reinforcement learning getraind locomotiebeleid combineert met een op de Koopman-operator gebaseerde lineaire dynamische voorspelling in een verheven ruimte, waardoor een modelvoorspellende regelaar (MPC) nauwkeurigere trajecten en verbeterde veiligheid in dichte omgevingen kan bereiken.

Jeonghwan Kim, Yunhai Han, Harish Ravichandar, Sehoon Ha2026-03-10💻 cs

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

InterMind is een door grote taalmodellen aangedreven systeem dat de diagnose van depressie verbetert door interactie tussen patiënt, arts en familie te faciliteren en interpretabele rapporten te genereren via geavanceerde technieken zoals retrieval-augmented generation en chain-of-thoughts.

Zhiyuan Zhou, Jilong Liu, Sanwang Wang, Shijie Hao, Yanrong Guo, Richang Hong2026-03-10💻 cs

Improving Visual Object Tracking through Visual Prompting

Dit paper introduceert PiVOT, een nieuwe visuele prompting-methode voor generiek objecttracking die een voorgeïmplementerd fundamenteel model (CLIP) gebruikt om online visuele prompts te genereren en te verfijnen, waardoor het tracker-model beter in staat is om storende objecten te onderdrukken en de prestaties te verbeteren.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Diagnosing and Repairing Distributed Routing Configurations Using Selective Symbolic Simulation

Dit paper introduceert S^2Sim, een nieuw systeem dat automatisch fouten in gedistribueerde routingconfiguraties diagnoseert en repareert door selectieve symbolische simulatie te gebruiken om intentie-conforme varianten te vinden.

Rulan Yang, Gao Han, Hanyang Shao, Xiaoqiang Zheng, Xing Fang, Ziyi Wang, Lizhao You, Ruiting Zhou, Linghe Kong, Ennan Zhai, Qiao Xiang, Jiwu Shu2026-03-10💻 cs

Pose Prior Learner: Unsupervised Categorical Prior Learning for Pose Estimation

Dit artikel introduceert de Pose Prior Learner (PPL), een zelftoezichtende methode die een generiek houdingsvoorkennis voor objectcategorieën leert via een hiërarchisch geheugen van prototypische houdingen, waardoor de schatting van houdingen, zelfs bij occlusie, aanzienlijk wordt verbeterd zonder extra menselijke annotaties.

Ziyu Wang, Shuangpeng Han, Mengmi Zhang2026-03-10💻 cs

ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance

ExpGest is een innovatief diffusion-model dat door het synchroniseren van tekst- en audio-informatie expressieve, natuurlijke en emotioneel gecontroleerde full-body gebaren genereert, waarmee het de beperkingen van bestaande methoden die zich uitsluitend op audio en het bovenlichaam richten, overwint.

Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu2026-03-10💻 cs

Optimal Mediation Mechanism in Bilateral Trade

Dit artikel onderzoekt de ontwerp van inkomstenmaximerende mechanismen voor een zelfzuchtige mediator in tweezijdige handel met interafhankelijke waarderingen, waarbij het een onmogelijkheidsresultaat aangaande prikkelcompatibiliteit, gehoorzaamheid en informativiteit vaststelt en vervolgens de optimale mechanismen analyseert onder de voorwaarden van constante kosten of vetorecht, wat respectievelijk leidt tot een drempelstructuur die lage types meer informatie biedt en een 'lemons market'-effect veroorzaakt.

Zhikang Fan, Weiran Shen, Shaojie Tang, Yao Wang2026-03-10💻 cs

I/O complexity and pebble games with partial computations

Dit paper introduceert een variant van het Pebble Game die partiële berekeningen toestaat om DAG's met willekeurige in-degrées te modelleren, en bewijst dat het bepalen van een optimale strategie NP-compleet is, zelfs voor eenvoudige gevallen.

Aleksandros Sobczyk2026-03-10💻 cs

← Vorige Volgende →