Deze collectie duikt in de fascinerende wereld van de chemie tussen atomen, waar de interacties tussen cesium en chloor leiden tot unieke verbindingen met opmerkelijke eigenschappen. Van de vorming van zouten tot complexe toepassingen in materialenwetenschap, onderzoeken deze studies hoe fundamentele chemische krachten nieuwe technologieën mogelijk maken.

Op Gist.Science bewaken we de stroom van nieuw onderzoek dat via arXiv wordt gepubliceerd. Voor elk nieuw preprint in dit domein genereren wij zowel een begrijpelijke samenvatting voor een breed publiek als een gedetailleerde technische analyse, zodat de inzichten voor iedereen toegankelijk zijn. Hieronder vindt u de meest recente publicaties in dit dynamische onderzoeksgebied.

Automatic identification of diagnosis from hospital discharge letters via weakly supervised Natural Language Processing

Dit artikel presenteert een zwak gesuperviseerde Natural Language Processing-pipeline die automatisch patiëntdiagnoses identificeert uit Italiaanse ontslagbrieven uit het ziekenhuis door gebruik te maken van zinextractie, domeinspecifieke semantische embeddings en twee-niveau clustering om zwakke labels te genereren, waardoor prestaties worden behaald die vergelijkbaar zijn met volledig gesuperviseerde modellen terwijl de noodzaak voor handmatige annotatie aanzienlijk wordt verminderd.

Vittorio Torri, Elisa Barbieri, Anna Cantarutti, Carlo Giaquinto, Francesca Ieva2026-06-15💬 cs.CL

Sentinel: Decoding Context Utilization via Attention Probing for Efficient LLM Context Compression

Sentinel is een lichtgewicht, training-vrij contextcompressiekader dat aandachtspatronen tijdens de inferentie decodeert uit bevroren LLM's om efficiënte, hoogwaardige retrieval-augmented generatie te bereiken met een compressie van tot wel 5×\times met slechts één enkele forward pass.

Yong Zhang, Heng Li, Yanwen Huang, Ning Cheng, Yang Guo, Yun Zhu, Yanmeng Wang, Shaojun Wang, Jing Xiao2026-06-15💬 cs.CL

Research Borderlands: Analysing Writing Across Research Cultures

Dit artikel stelt een mensgericht kader voor het analyseren en meten van culturele normen in wetenschappelijk schrijven, waarbij interdisciplinaire interviews worden gebruikt om de belangrijkste stilistische en retorische verschillen tussen onderzoeksculturen te identificeren en te demonstreren hoe deze metrieken de neiging van grote taalmodellen onthullen om het schrijven te homogeniseren in plaats van zich aan te passen aan specifieke culturele contexten.

Shaily Bhatt, Tal August, Maria Antoniak2026-06-15💬 cs.CL

Trusted Uncertainty in Large Language Models: A Unified Framework for Confidence Calibration and Risk-Controlled Refusal

Het artikel introduceert UniCR, een uniform kader dat heterogene onzekerheidsbewijzen fuseert tot gekalibreerde correctheidskansen om door de gebruiker gespecificeerde foutbudgetten af te dwingen via principiële weigering, waardoor de betrouwbaarheid wordt verbeterd en hallucinaties in grote taalmodellen worden verminderd zonder dat fijninstelling van het basismodel vereist is.

Markus Oehri, Giulia Conti, Kaviraj Pather, Alexandre Rossi, Laia Serra, Adrian Parody, Rogvi Johannesen, Aviaja Petersen, Arben Krasniqi2026-06-15💬 cs.CL

Residual Context Diffusion Language Models

Dit artikel introduceert Residual Context Diffusion (RCD), een nieuwe module die weggegooide token-representaties recycleert als contextuele residuen om de nauwkeurigheid en efficiëntie van Diffusion Large Language Models (dLLMs) aanzienlijk te verhogen met minimale extra berekening en trainingsdata.

Yuezhou Hu, Harman Singh, Monishwaran Maheswaran, Haocheng Xi, Coleman Hooper, Jintao Zhang, Aditya Tomar, Michael W. Mahoney, Sewon Min, Mehrdad Farajtabar, Kurt Keutzer, Amir Gholami, Chenfeng Xu2026-06-15💬 cs.CL

SciDef: Datasets and Tools for Automated Definition Extraction from Scientific Literature with LLMs

Het artikel introduceert SciDef, een uitgebreid pakket aan middelen bestaande uit de DefExtra-benchmark, DefSim-gelijkenisbeoordelingen en een open LLM-gebaseerde pijplijn om geautomatiseerde extractie van wetenschappelijke definities te bevorderen, terwijl het relevantiebewuste filtering identificeert als de primaire uitdaging voor volledig automatische systemen.

Filip Kučera, Christoph Mandl, Isao Echizen, Radu Timofte, Timo Spinde2026-06-15💬 cs.CL

Deep Dense Exploration for LLM Reinforcement Learning via Pivot-Driven Resampling

Dit artikel stelt Deep Dense Exploration (DDE) voor, een nieuwe strategie geïnstantieerd als DEEP-GRPO die het reinforcement learning van LLM's verbetert door "pivot"-toestanden binnen onsuccesvolle trajecten te identificeren en dicht te herbemonsteren om efficiënt hoogwaardige oplossingen te ontdekken, waardoor het bestaande GRPO- en boomgebaseerde methoden op benchmarks voor wiskundig redeneren overtreft.

Yiran Guo, Zhongjian Qiao, Yingqi Xie, Jie Liu, Dan Ye, Ruiqing Zhang, Shuang Qiu, Lijie Xu2026-06-15💬 cs.CL

Deja Vu at Scale: Paraphrase-Robust Detection of Duplicate Gherkin Steps in Behaviour-Driven Software Testing with Sentence-Transformer Embeddings and a 1.1M-Step Open Benchmark

Dit artikel behandelt de onderhoudskosten van dubbele Gherkin-stappen in Behaviour-Driven Development door het vrijgeven van een grootschalige, organisatieoverstijgende benchmark van meer dan 1,1 miljoen stappen en het introduceren van een parafrase-robuuste detector die exacte, lexicale en semantische methoden combineert om significante elimineerbare redundantie te identificeren en te kwantificeren.

Ali Hassaan Mughal, Noor Fatima, Muhammad Bilal2026-06-15💬 cs.CL