Activation Steering for Masked Diffusion Language Models

Deze studie introduceert een effectieve activatiestuuringsmethode voor Masked Diffusion Language Models die, door het toepassen van een enkele laagdimensionale richting op de residual-stream-activaties tijdens het reverse diffusion-proces, systematische gedragsveranderingen mogelijk maakt zonder optimalisatie, waarbij specifieke kenmerken zoals de bruikbaarheid van pre-instructie-tokens en cross-linguale transfer worden aangetoond die uniek zijn voor deze architectuur.

Adi Shnaidman, Erin Feiglin, Osher Yaari + 3 more2026-03-04💬 cs.CL

ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels

Deze paper introduceert ClinConsensus, een door klinische experts gevalideerde benchmark in het Chinees die grote taalmodellen evalueert op basis van open-ended medische casuïstiek met variërende moeilijkheidsgraden, en een nieuw beoordelingskader voorstelt om de betrouwbaarheid en klinische toepasbaarheid van deze modellen in realistische zorgscenario's te meten.

Xiang Zheng, Han Li, Wenjie Luo + 9 more2026-03-04💬 cs.CL