Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

Dit onderzoek evalueert de prestaties van verschillende grote taalmodellen bij het oplossen van discrete optimalisatieproblemen met uitgebreide datasets en concludeert dat sterkere modellen beter presteren, terwijl de Chain-of-Thought-techniek niet altijd effectief is en verstoord data soms de prestaties op eenvoudige problemen kan verbeteren.

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

Het artikel introduceert DECADE, een onbewaakte diffusiemodel dat tijdsconsistentie toepast om ruis in dynamische Rb-82 hart-PET-beelden te verminderen en zo de beeldkwaliteit en kwantitatieve nauwkeurigheid verbetert zonder gebruik te maken van gepaarde trainingsdata.

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Deze studie toont aan dat grote taalmodellen in de Nepalese context aanzienlijke sociale vooroordelen vertonen, waarbij impliciete generatieve bias sterk verschilt van expliciete instemming en een niet-lineair verband vertoont met de temperatuurinstelling, wat de noodzaak benadrukt van cultureel onderbouwde evaluatie- en debiasingstrategieën.

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

Gradient Iterated Temporal-Difference Learning

Dit paper introduceert Gradient Iterated Temporal-Difference learning, een nieuw algoritme dat de stabiliteit van gradient TD-methoden verbetert door de gradiënten over bewegende doelen te berekenen, waardoor het voor het eerst een concurrerende leersnelheid bereikt ten opzichte van semi-gradiënt-methoden op benchmarks zoals Atari-games.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Steerability 360: A Toolkit for Steering Large Language Models

Dit paper introduceert AI Steerability 360, een open-source Python-bibliotheek van IBM die een gestandaardiseerde interface biedt om grote taalmodellen via vier controleoppervlakken (invoer, structuur, staat en uitvoer) te sturen en verschillende stuurmethoden eenvoudig te combineren en evalueren.

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

Het paper introduceert SynPlanResearch-R1, een framework dat synthetische trajecten genereert om de verkenning van tools te stimuleren tijdens de koude-start-fase van deep research agents, wat leidt tot aanzienlijke prestatieverbeteringen op meerdere benchmarks in vergelijking met bestaande methoden.

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL