cs.AI papers | Gist.Science

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

Deze paper introduceert SketchGraphNet, een geheugenefficiënte hybride graf-Transformer die vrijehandtekeningen direct als gestructureerde grafen modelleert en een nieuw benchmark-dataset van 3,44 miljoen schetsen presenteert om grootschalige tekenherkenning te verbeteren.

Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao2026-03-10💻 cs

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

Dit paper introduceert een op neurale dynamiek gebaseerd voorgeöpleid raamwerk dat, in tegenstelling tot bestaande methoden, gepersonaliseerde hersenfunctionele netwerken construeert door neurale activiteitspatronen in heterogene scenario's nauwkeuriger te vangen, wat leidt tot superieure prestaties en generaliseerbaarheid.

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

Dit paper introduceert UniLongGen, een trainingsvrije inferentiestrategie die de betrouwbaarheid van langdurige, interleaved beeldgeneratie in unified multimodale modellen verbetert door dynamisch irrelevante visuele informatie te verwijderen en zo de ophoping van visuele vervuiling te voorkomen.

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration

DreamSAC is een nieuw kader dat extrapolatie in 3D-fysica verbetert door een agent te laten verkennen via symmetrie-ontdekking en een Hamiltoniaans wereldmodel te leren dat behoudswetten identificeert uit ruwe pixelobservaties.

Jinzhou Tang, Fan Feng, Minghao Fu, Wenjun Lin, Biwei Huang, Keze Wang2026-03-10🤖 cs.LG

COOL-MC: Verifying and Explaining RL Policies for Multi-bridge Network Maintenance

Dit paper introduceert COOL-MC, een tool die probabilistische modelchecking en uitlegbare methoden gebruikt om te verifiëren en te verklaren hoe een reinforcement learning-beleid voor het onderhoud van een netwerk van drie bruggen presteert, waarbij een veiligheidsrisico van 3,5% en een systematische bias naar brug 1 worden geïdentificeerd.

Dennis Gross2026-03-10🤖 cs.LG

Learning-free L2-Accented Speech Generation using Phonological Rules

Deze paper introduceert een leermethode-vrij framework voor het genereren van Engels met een Spaans of Indiaas accent door fonologische regels toe te passen op een meertalige TTS-model, waardoor accenten op phonemisch niveau kunnen worden gemanipuleerd zonder grote datasets.

Thanathai Lertpetchpun, Yoonjeong Lee, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan2026-03-10💬 cs.CL

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

Deze paper introduceert een nieuw raamwerk voor 'Speech Generation Speaker Poisoning' om de privacyrisico's van zero-shot tekst-naar-spraakmodellen te beperken door specifieke stemidentiteiten te verwijderen, waarbij wordt aangetoond dat dit effectief werkt voor tot 15 sprekers maar schaalbaarheidsproblemen ondervindt bij 100 sprekers.

Thanapat Trachu, Thanathai Lertpetchpun, Sai Praneeth Karimireddy, Shrikanth Narayanan2026-03-10💻 cs

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

De auteurs presenteren Nwāchā Munā, een nieuw spraakcorpus en benchmark voor de bedreigde Nepal Bhasha-taal, en tonen aan dat effectieve spraakherkenning mogelijk is door middel van computerefficiënte, taalkundig nabije transfer van het Nepalees, in plaats van zware meertalige modellen.

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal2026-03-10💬 cs.CL

GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

Het paper introduceert GRD-Net, een nieuw model voor industriële afwijkingdetectie dat een generatieve reconstructie-architectuur combineert met een discriminatieve module voor segmentatie van gebieden van belang, waardoor de afhankelijkheid van vooraf gedefinieerde voorverwerkingsalgoritmen wordt verminderd en de generalisatie op zowel synthetische als realistische industriële datasets wordt verbeterd.

Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma2026-03-10🤖 cs.LG

A Systematic Comparison of Training Objectives for Out-of-Distribution Detection in Image Classification

Dit artikel presenteert een systematische vergelijking van vier trainingsdoelen voor het detecteren van out-of-distributie in beeldclassificatie en concludeert dat Cross-Entropy Loss over het algemeen de meest consistente prestaties levert, hoewel andere methoden in specifieke scenario's concurrerend kunnen zijn.

Furkan Genç, Onat Özdemir, Emre Akbas2026-03-10🤖 cs.LG

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

Dit paper presenteert een semi-supervised anomaliedetectieframework op basis van generatieve adversariale netwerken dat is ontworpen voor online implementatie op een hoge-snelheids Blow-Fill-Seal-productielijn, waar het met hoge nauwkeurigheid en binnen strikte tijdsbeperkingen defecten detecteert door enkel te trainen op nominale monsters.

Niccolò Ferrari, Nicola Zanarini, Michele Fraccaroli, Alice Bizzarri, Evelina Lamma2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

Dit paper introduceert DSS-GRPO, een difficulty-geschaalde segment-gebaseerde versterkingsleermethode die Chain-of-Thought-redenering effectief comprimeert zonder de kwaliteit van het eindantwoord te beïnvloeden door de leerprocessen voor 'denken' en 'antwoorden' strikt te scheiden.

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

Dit artikel introduceert SMAT, een gestructureerd trainingskader voor co-adaptieve exoskeletbesturing dat via een vierstapscurriculum een robuust en subjectonafhankelijk hulpmiddel levert dat de heupspieractivatie met gemiddeld 10,1% verlaagt en consistente positieve mechanische kracht genereert zonder specifieke aanpassing per gebruiker.

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Dit artikel introduceert een synthetische data-pipeline op basis van een digitale tweeling van de luchthaven van Algiers die, in combinatie met YOLO-OBB en gemengde training, de annotatie-inspanning voor het detecteren van bagagewagentjes met 25 tot 35 procent verlaagt terwijl de prestaties gelijk blijven aan of beter zijn dan die van modellen getraind op volledige real-world datasets.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Deze paper introduceert AtomicVLA, een unificerend kader voor robotplanning en -executie dat via een Skill-Guided Mixture-of-Experts (SG-MoE) schaalbare atomaire vaardigheden leert en dynamisch combineert, waardoor robuustere prestaties worden bereikt bij langdurige taken en voortdurend leren in vergelijking met bestaande VLA-modellen.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Ref-DGS: Reflective Dual Gaussian Splatting

Ref-DGS is een nieuw framework dat reflecterende oppervlakken efficiënt reconstrueert en nieuwe weergaven synthetiseert door geometrie en lokale reflecties te scheiden in een dubbele Gaussische representatie, waardoor het de snelheid van Rasterisatie combineert met de nauwkeurigheid van straalvolgende methoden zonder de hoge rekentkosten.

Ningjing Fan, Yiqun Wang, Dongming Yan, Peter Wonka2026-03-10💻 cs

AI-Driven Phase Identification from X-ray Hyperspectral Imaging of cycled Na-ion Cathode Materials

Dit artikel presenteert een door AI-aangedreven methode die hyperspectrale STXM-data van Na-ion kathodematerialen onder ruwe bemonsteringsomstandigheden verwerkt om nanoschaal-faseheterogeniteit en -evolutie in individuele deeltjes nauwkeurig in kaart te brengen.

Fayçal Adrar, Nicolas Folastre, Chloé Pablos, Stefan Stanescu, Sufal Swaraj, Raghvender Raghvender, François Cadiou, Laurence Croguennec, Matthieu Bugnet, Arnaud Demortière2026-03-10🔬 cond-mat.mtrl-sci

Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers

Dit survey biedt een gestructureerd overzicht van de mechanismen, evaluatie en opkomende frontiers voor geheugen in autonome LLM-agenten, waarbij het geheugen wordt geformaliseerd als een schrijf-beheer-lees-lus en wordt onderzocht via een drie-dimensionale taxonomie, vijf mechanismefamilies, evaluatiemethoden en praktische toepassingen tot in 2026.

Pengfei Du2026-03-10💻 cs

Compressed-Domain-Aware Online Video Super-Resolution

Dit paper introduceert CDA-VSR, een efficiënt online video super-resolutie-netwerk dat gecomprimeerde domein-informatie zoals bewegingsvectoren en residukaarten benut om de kwaliteit te verbeteren en de inferentiesnelheid te verdubbelen ten opzichte van bestaande methoden.

Yuhang Wang, Hai Li, Shujuan Hou, Zhetao Dong, Xiaoyao Yang2026-03-10💻 cs

TDM-R1: Reinforcing Few-Step Diffusion Models with Non-Differentiable Reward

TDM-R1 is een nieuwe versterkingsleerparadigma dat few-step diffusiemodellen effectief optimaliseert met niet-differentieerbare beloningen door het leerproces te ontkoppelen in surrogaatbeloningslering en generatorlering, wat leidt tot state-of-the-art prestaties in diverse generatietaken.

Yihong Luo, Tianyang Hu, Weijian Luo, Jing Tang2026-03-10💻 cs

← Vorige Volgende →