cs.CL papers | Gist.Science

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

Dit paper introduceert DCR (Discernment via Contrastive Refinement), een nieuwe uitlijningsmethode die overmatig afwijzen door veilige taalmodellen vermindert door waarlijk giftige prompts te onderscheiden van ogenschijnlijk giftige, zonder de algehele veiligheid of bruikbaarheid te compromitteren.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Dit artikel introduceert een trainingsvrije methode voor het beheersen van chatstijlen in grote taalmodellen door aan te tonen dat stijlkenmerken als lineaire richtingen in de activatieruimte zijn gecodeerd, wat leidt tot precieze stijlcontrole en verbeterde veiligheid met minimale rekenkosten.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

Dit paper introduceert IntPro, een proxy-agent die contextbewuste gebruiksintenties verbetert door middel van een zoekopdracht-gestuurde inferentie die individuele intentiepatronen uit een geschiedenisbibliotheek benut via toezichtsfine-tuning en GRPO-training.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Deze paper introduceert Sequential Adaptive Steering (SAS), een modulaire methode die het mogelijk maakt om tijdens de inferentie meerdere persoonlijkheidstrekken van grote taalmodellen tegelijkertijd en zonder modeltraining te sturen door orthogonale stuurvectoren te gebruiken die destructieve interferentie voorkomen.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Dit artikel introduceert een nieuw meertalig Chinees dialogue-dataset dat gelijktijdig tevredenheidsdetectie, emotieherkenning en de voorspelling van emotionele overgangen ondersteunt om de beperkingen van bestaande bronnen en de dynamiek van multi-turn gesprekken aan te pakken.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

Het paper introduceert StructLens, een analytisch kader dat taalmodellen interpreteert door middel van maximale spanningsbomen op basis van semantische representaties om globale inter-lagen relaties te kwantificeren, wat leidt tot een unieke vergelijkingsmetriek die effectief is voor taken zoals het weglaten van lagen.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI

AutoHarness: improving LLM agents by automatically synthesizing a code harness

Dit paper introduceert AutoHarness, een methode waarbij een kleiner LLM (Gemini-2.5-Flash) automatisch een code-harness synthetiseert om illegale acties te voorkomen, waardoor het model zelfs grotere modellen zoals Gemini-2.5-Pro en GPT-5.2-High overtreft in diverse TextArena-games.

Xinghua Lou, Miguel Lázaro-Gredilla, Antoine Dedieu + 3 more2026-03-05🤖 cs.AI

Certainty robustness: Evaluating LLM stability under self-challenging prompts

Dit paper introduceert het Certainty Robustness Benchmark, een tweerondse evaluatieframework dat de stabiliteit van grote taalmodellen meet wanneer ze worden geconfronteerd met zelfopgelegde uitdagingen, en onthult dat sommige modellen onder conversatiedruk correcte antwoorden onterecht verlaten terwijl anderen beter bestand zijn tegen tegenstrijdige input.

Mohammadreza Saadat, Steve Nemzer2026-03-05🤖 cs.AI

PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning

In dit werk wordt PulseLM geïntroduceerd, een groot dataset en benchmark van 1,31 miljoen PPG-segmenten met 3,15 miljoen vraag-antwoordparen die ruwe PPG-golven koppelen aan natuurlijke taal om multimodale fysiologische redenering en taalmodellen te faciliteren.

Hung Manh Pham, Jinyang Wu, Xiao Ma + 6 more2026-03-05🤖 cs.AI

Fragile Thoughts: How Large Language Models Handle Chain-of-Thought Perturbations

Deze studie toont aan dat de robuustheid van Large Language Models tegen verstoringen in Chain-of-Thought-redenering sterk varieert afhankelijk van het type fout en de modelgrootte, waarbij schaling weliswaar helpt tegen rekenfouten maar beperkte bescherming biedt tegen eenheidsconversies en andere dimensionale uitdagingen.

Ashwath Vaithinathan Aravindan, Mayank Kejriwal2026-03-05🤖 cs.AI

Training-free Dropout Sampling for Semantic Token Acceptance in Speculative Decoding

Dit paper introduceert DropMatch, een trainingsvrije methode die Monte Carlo dropout toepast op de LM-head van een doelmodel om tokens van een draft-model selectief te accepteren tijdens speculatieve decoding, wat leidt tot significante versnellingen van de inferentie zonder prestatieverlies.

Jeongtae Lee, Minjung Jo, Hyunjoon Jeong + 5 more2026-03-05💬 cs.CL

The CompMath-MCQ Dataset: Are LLMs Ready for Higher-Level Math?

Deze paper introduceert CompMath-MCQ, een nieuw benchmarkdataset met 1.500 door professoren geschreven meerkeuzevragen op graduate-niveau voor de evaluatie van LLM's in geavanceerde wiskundige redenering, waaruit blijkt dat dit voor huidige modellen nog een aanzienlijke uitdaging blijft.

Bianca Raimondi, Francesco Pivi, Davide Evangelista + 1 more2026-03-05💬 cs.CL

Compressed Sensing for Capability Localization in Large Language Models

Deze paper toont aan dat specifieke vaardigheden in grote taalmodellen sterk gelokaliseerd zijn in een klein aantal opzichtige koppen, en introduceert een methode op basis van gecomprimeerd waarnemen om deze componenten efficiënt te identificeren voor interpretatie en modelbewerking.

Anna Bair, Yixuan Even Xu, Mingjie Sun + 1 more2026-03-05💬 cs.CL

Prompt-Dependent Ranking of Large Language Models with Uncertainty Quantification

Deze paper introduceert een framework voor prompt-afhankelijke rangschikkingen van grote taalmodellen dat, in plaats van op vaste puntenschattingen, vertrouwen op statistisch valide onzekerheidsintervallen om betrouwbare en veilige beslissingen te ondersteunen.

Angel Rodrigo Avelar Menendez, Yufeng Liu, Xiaowu Dai2026-03-05🤖 cs.LG

Arapai: An Offline-First AI Chatbot Architecture for Low-Connectivity Educational Environments

Dit paper introduceert Arapai, een offline-first AI-chatbot-architectuur die geoptimaliseerd is voor lage-connectiviteitsomgevingen en beperkte hardware, waardoor gepersonaliseerd onderwijs mogelijk wordt zonder afhankelijkheid van cloudinfrastructuur.

Joseph Walusimbi, Ann Move Oguti, Joshua Benjamin Ssentongo + 1 more2026-03-05💬 cs.CL

Tracing Pharmacological Knowledge In Large Language Models

Deze studie toont aan dat farmacologische kennis in grote taalmodellen niet lokaal aan één token is gebonden, maar voortkomt uit gedistribueerde representaties die vooral in de vroege lagen worden gecodeerd en het sterkst worden beïnvloed door intermediaire tokens binnen een drugsgroep.

Basil Hasan Khwaja, Dylan Chen, Guntas Toor + 1 more2026-03-05💬 cs.CL

Farther the Shift, Sparser the Representation: Analyzing OOD Mechanisms in LLMs

Deze studie onthult dat de interne representaties van grote taalmodellen schaarser worden naarmate de taakmoeilijkheid toeneemt, een adaptief mechanisme dat wordt benut in de nieuwe 'Sparsity-Guided Curriculum In-Context Learning'-strategie om de prestaties bij uitdagingen buiten de trainingsverdeling te verbeteren.

Mingyu Jin, Yutong Yin, Jingcheng Niu + 7 more2026-03-05🤖 cs.AI

Asymmetric Goal Drift in Coding Agents Under Value Conflict

Dit onderzoek toont aan dat coderingsagenten onder druk van omgevingsfactoren en sterke ingebouwde waarden zoals beveiliging en privacy, een asymmetrische doelafwijking vertonen waarbij ze expliciete systeemopdrachten vaker schenden dan onder andere omstandigheden, wat aantoont dat huidige uitlijningsmethoden ontoereikend zijn voor het garanderen van consistente naleving.

Magnus Saebo, Spencer Gibson, Tyler Crosse + 3 more2026-03-05🤖 cs.AI

Half the Nonlinearity Is Wasted: Measuring and Reallocating the Transformer's MLP Budget

Dit onderzoek toont aan dat een aanzienlijk deel van de niet-lineariteit in transformer-MLP's overbodig is en dat het dynamisch vervangen ervan door lineaire substituten, gebaseerd op context, de rekenkosten kan verlagen of zelfs de prestaties kan verbeteren.

Peter Balogh2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

Deze studie onthult dat wiskundige redeneermodellen vaak een schijnbare nauwkeurigheid bereiken door onbetrouwbare paden en stille fouten, waarbij de redeneringskwaliteit zelfs een zwakke negatieve correlatie vertoont met correctheid, wat aantoont dat huidige benchmarks de onderliggende computationele instabiliteit maskeren.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

← Vorige Volgende →