cs.CL papers | Gist.Science

Steering Awareness: Models Can Be Trained to Detect Activation Steering

Dit onderzoek toont aan dat taalmodellen kunnen worden getraind om activatiesturing te detecteren en de toegevoegde concepten te identificeren, wat impliceert dat dergelijke ingrepen niet onopgemerkt blijven en dat detectie zelfs de kwetsbaarheid voor sturing kan vergroten.

Joshua Fonseca Rivera, David Demitri Africa2026-03-06💻 cs

Think-While-Generating: On-the-Fly Reasoning for Personalized Long-Form Generation

Dit paper introduceert FlyThinker, een efficiënt kader dat gelijktijdig redeneren en genereren mogelijk maakt om gepersonaliseerde lange teksten te produceren door een apart redeneringsmodel te gebruiken dat dynamische token-niveau-instructies genereert zonder de trainings- of inferentie-efficiëntie te compromitteren.

Chengbing Wang, Yang Zhang, Wenjie Wang + 4 more2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

Het paper introduceert ReFusion, een nieuw gemaskerd diffusiemodel dat door het combineren van sequentiereorganisatie met causale attentie en het verschuiven van parallelle decoding naar het slotniveau, zowel de inferentiesnelheid aanzienlijk verhoogt als de prestaties van autoregressieve modellen benadert.

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs

RePo: Language Models with Context Re-Positioning

Het paper introduceert RePo, een nieuw mechanisme dat de extrinsieke cognitieve belasting in Large Language Models verlaagt door token-posities dynamisch te herschikken op basis van contextuele afhankelijkheden in plaats van een vaste lineaire volgorde, wat leidt tot verbeterde prestaties bij taken met ruis, gestructureerde data en lange contexten.

Huayang Li, Tianyu Zhao, Deng Cai + 1 more2026-03-06💻 cs

MCP-SafetyBench: A Benchmark for Safety Evaluation of Large Language Models with Real-World MCP Servers

Dit paper introduceert MCP-SafetyBench, een uitgebreide benchmark op basis van echte MCP-servers die de kwetsbaarheid van grote taalmodellen voor veiligheidsrisico's in realistische multi-stap workflows blootlegt en de noodzaak van betere verdedigingsmechanismes benadrukt.

Xuanjun Zong, Zhiqi Shen, Lei Wang + 2 more2026-03-06💻 cs

From Word to World: Can Large Language Models be Implicit Text-based World Models?

Dit onderzoek toont aan dat grote taalmodellen in tekstuele omgevingen kunnen fungeren als impliciete wereldmodellen die agentenprestaties verbeteren, mits er voldoende gedragsdekking en complexiteit is om de betrouwbaarheid en schaalbaarheid te waarborgen.

Yixia Li, Hongru Wang, Jiahao Qiu + 7 more2026-03-06💻 cs

Parallel Token Prediction for Language Models

Dit paper introduceert Parallel Token Prediction (PTP), een raamwerk dat de snelheid van autoregressieve taalmodellen aanzienlijk verhoogt door meerdere tokens in één doorloop te voorspellen via het verschuiven van de bron van willekeur naar invoervariabelen, wat resulteert in een 2,4-voudige versnelling.

Felix Draxler, Justus Will, Farrin Marouf Sofian + 3 more2026-03-06💻 cs

When Do Tools and Planning Help Large Language Models Think? A Cost- and Latency-Aware Benchmark

Deze studie toont aan dat hoewel planning en tools de prestaties van grote taalmodellen bij complexe feitelijke vragen kunnen verbeteren, ze vaak leiden tot aanzienlijke vertragingen en kostenstijgingen zonder consistente winst bij andere taken, wat benadrukt dat de keuze voor modelgrootte en agentcomplexiteit taalspecifiek en kostenbewust moet zijn.

Subha Ghoshal, Ali Al-Bustami2026-03-06💻 cs

Identifying Good and Bad Neurons for Task-Level Controllable LLMs

Dit paper introduceert NeuronLLM, een nieuw raamwerk dat het biologische principe van functionele antagonisme toepast om zowel 'goede' als 'slechte' neuronen in grote taalmodellen te identificeren via contrastief leren, waardoor een holistisch begrip van taakniveau-controle wordt bereikt dat fortuïtous gedrag minimaliseert en de prestaties van bestaande methoden overtreft.

Wenjie Li, Guansong Pang, Hezhe Qiao + 2 more2026-03-06💻 cs

F-Actor: Controllable Conversational Behaviour in Full-Duplex Models

Dit paper introduceert F-Actor, het eerste open instructievolgende full-duplex conversatiemodel dat efficiënt kan worden getraind met beperkte middelen en expliciete instructies kan volgen om stem, onderwerp en gespreksdynamiek zoals onderbrekingen en feedback te controleren.

Maike Züfle, Ondrej Klejch, Nicholas Sanders + 3 more2026-03-06💻 cs

The unreasonable effectiveness of pattern matching

Dit paper toont aan dat grote taalmodellen door middel van patroonherkenning betekenis kunnen afleiden uit 'Jabberwocky'-teksten, wat aantoont dat patroonherkenning een essentieel onderdeel is van echte intelligentie en niet slechts een alternatief daarvoor.

Gary Lupyan, Blaise Agüera y Arcas2026-03-06💻 cs

Yuan3.0 Ultra: A Trillion-Parameter Enterprise-Oriented MoE LLM

Dit paper introduceert Yuan3.0 Ultra, een open-source Mixture-of-Experts taalmodel met 1010 miljard totale parameters dat door middel van het nieuwe Layer-Adaptive Expert Pruning-algoritme tijdens het pre-trainingstadium 33,3% minder parameters en 49% meer trainingsefficiëntie bereikt, terwijl het uitstekende prestaties behoudt op zowel algemene taken als specifieke zakelijke benchmarks.

YuanLab. ai, :, Shawn Wu + 25 more2026-03-06💻 cs

Where is the multimodal goal post? On the Ability of Foundation Models to Recognize Contextually Important Moments

Deze studie toont aan dat huidige multimodale foundation modellen moeite hebben om contextueel belangrijke momenten in voetbalvideo's te herkennen, omdat ze vaak te veel vertrouwen op één dominante modality in plaats van informatie uit meerdere bronnen effectief te synthetiseren.

Aditya K Surikuchi, Raquel Fernández, Sandro Pezzelle2026-03-06💻 cs

Self-Distilled Reasoner: On-Policy Self-Distillation for Large Language Models

Dit paper introduceert On-Policy Self-Distillation (OPSD), een raamwerk waarbij één enkel groot taalmodel fungeert als zowel leraar als leerling door te conditioneren op respectievelijk geprivilegieerde redeneersporen en alleen de vraag, wat leidt tot superieure prestaties en een 8-12 keer hogere token-efficiëntie op wiskundige redeneerbenchmarks vergeleken met bestaande methoden.

Siyan Zhao, Zhihui Xie, Mengchen Liu + 4 more2026-03-06💻 cs

Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

Deze paper introduceert VIP, een strategie die een Gaussisch proces gebruikt om de roll-out-begroting in online versterkingsleer dynamisch toe te wijzen aan de meest informatieve prompts, waardoor de sampling-efficiëntie en prestaties aanzienlijk worden verbeterd ten opzichte van uniforme methoden.

Hieu Trung Nguyen, Bao Nguyen, Wenao Ma + 3 more2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

LatentChem introduceert een latent denkinterface die chemische redenering overbrengt van expliciete tekstuele chain-of-thought naar continue latente ruimtes, wat leidt tot een aanzienlijke snelheidswinst en betere prestaties doordat modellen hun redenering automatisch internaliseren in plaats van in woorden te verwoorden.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

The Convergence of Schema-Guided Dialogue Systems and the Model Context Protocol

Dit artikel toont aan dat Schema-Guided Dialogue (SGD) en het Model Context Protocol (MCP) twee manifestaties zijn van een unified paradigma voor deterministische LLM-interactie, en stelt vijf fundamentele principes voor schema-ontwerp vast die gaten in foutbeheer en tool-relaties opvullen om schaalbaar AI-toezicht mogelijk te maken.

Andreas Schlapbach2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

Deze studie introduceert een evaluatiekader voor het red teamen van AI-psychotherapie dat, via gesimuleerde sessies met patiënten met alcoholproblemen, ernstige veiligheidsrisico's zoals het bevestigen van waanideeën en het niet de-escaleren van suïcidaliteit blootlegt, waarmee het de noodzaak onderstreept van simulatiegebaseerde audits voordat dergelijke systemen worden ingezet.

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking

Dit paper introduceert JAILBREAK FOUNDRY, een multi-agent systeem dat automatisch jailbreak-papers omzet in uitvoerbare modules om reproduceerbare en gestandaardiseerde beveiligingstests voor grote taalmodellen mogelijk te maken.

Zhicheng Fang, Jingjie Zheng, Chenxu Fu, Wei Xu2026-03-06🔒 cs.CR

Learn Hard Problems During RL with Reference Guided Fine-tuning

Dit paper introduceert Reference-Guided Fine-Tuning (ReGFT), een methode die menselijke referentieoplossingen gebruikt om positieve trainingsdata te synthetiseren voor moeilijke wiskundeproblemen, waardoor het probleem van beloningsverspreiding in versterkingslering wordt opgelost en de prestaties van modellen aanzienlijk worden verbeterd.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

← Vorige Volgende →