Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

Dit artikel introduceert PubHealthBench, een nieuwe benchmark met meer dan 8000 vragen gebaseerd op Britse overheidsrichtlijnen om de kennis van LLMs op het gebied van volksgezondheid te evalueren, waarbij wordt geconstateerd dat hoewel de nieuwste modellen bij meerkeuzevragen menselijke prestaties overtreffen, hun prestaties bij open antwoorden beperkter blijven en aanvullende veiligheidsmaatregelen vereisen.

Joshua Harris, Fan Grayson, Felix Feldman + 8 more2026-03-05🤖 cs.LG

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

TSPulse is een familie van ultralichte, vooraf getrainde modellen met ontkoppelde representaties die door middel van een innovatief pre-training framework en hybride masking strategie superieure zero-shot prestaties en efficiëntie biedt op diverse tijdsreeksdiagnostische taken, zelfs in vergelijking met modellen die 10 tot 100 keer groter zijn.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Dit artikel onderzoekt de convergentie- en ontsnappingsdynamica van Stochastic Gradient Descent in één dimensionale landschappen met oneindige of eindige variantie, waarbij wordt aangetoond dat de tijdschalen voor het bereiken van lokale minima en het verlaten van nabijgelegen maxima worden bepaald door de interactie tussen ruiskenmerken en de geometrie van de functie.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Deze paper introduceert Supervised Calibration (SC), een unificerend framework dat de beperkingen van bestaande kalibratiemethoden voor In-Context Learning in LLMs overwint door het leren van optimale affiene transformaties in de logit-ruimte, waardoor de beslissingsgrenzen effectief kunnen worden aangepast en de prestaties aanzienlijk worden verbeterd.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

Structural Vibration Monitoring with Diffractive Optical Processors

Deze paper introduceert een energiezuinig en kosteneffectief systeem voor het monitoren van structurele trillingen dat een gezamenlijk geoptimaliseerde diffractieve laag combineert met een ondiep neuronaal netwerk om 3D-trillingsspectra van constructies op afstand en in real-time te reconstrueren, wat een aanzienlijke verbetering in nauwkeurigheid biedt ten opzichte van conventionele methoden.

Yuntian Wang, Zafer Yilmaz, Yuhang Li + 5 more2026-03-05🔬 physics.optics