A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

In dit artikel wordt een nieuw trust-region interior-point stochastisch sequentieel kwadratisch programmeringsalgoritme (TR-IP-SSQP) voorgesteld voor het oplossen van optimalisatieproblemen met een stochastische doelfunctie en deterministische niet-lineaire constraints, waarvan de globale convergentie naar stationaire punten wordt bewezen en de praktische prestaties worden getest op CUTEst-problemen en logistische regressie.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Deze studie presenteert een doorbraak waarbij een compact en performant hematopoëtisch algoritme wordt geëxtraheerd uit de interne mechanica van het foundation-model scGPT, wat resulteert in een standalone methode die zonder hertraining superieure prestaties levert ten opzichte van bestaande tools en de interpretatie van biologische foundation-modellen mogelijk maakt.

Ihor Kendiukhov2026-03-12🧬 q-bio

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Deze paper introduceert en bewijst dat exponentiële reward-gewogen SFT een robuustere en schaalbaarder post-training methode is voor generatieve aanbevelingssystemen dan RLHF, omdat deze direct op waargenomen beloningen werkt zonder reward-modellen of propensity scores, terwijl de temperatuurparameter de afweging tussen robuustheid en verbetering theoretisch en empirisch regelt.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG