SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

Het artikel introduceert SPINE, een token-selectief test-tijd versterkingsleerframework dat alleen kritieke besluitvormingspunten in redeneringsketens aanpast met entropie-band regularisatie om instabiliteit en lengte-inzakking te voorkomen, waardoor de prestaties van grote taalmodellen zonder labels worden verbeterd.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

Creating a Hybrid Rule and Neural Network Based Semantic Tagger using Silver Standard Data: the PyMUSAS framework for Multilingual Semantic Annotation

Dit paper introduceert het PyMUSAS-framework, dat een hybride aanpak combineert van regels en neurale netwerken voor meertalige semantische annotatie in het USAS-systeem, waarbij gebruik wordt gemaakt van een nieuw 'silver standard'-dataset om de prestaties te evalueren en te verbeteren.

Andrew Moore, Paul Rayson, Dawn Archer, Tim Czerniak, Dawn Knight, Daisy Lal, Gearóid Ó Donnchadha, Mícheál Ó Meachair, Scott Piao, Elaine Uí Dhonnchadha, Johanna Vuorinen, Yan Yabo, Xiaobin Yang2026-03-09💬 cs.CL

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Dit paper introduceert Latent Exploration Decoding (LED), een trainingsvrije decodingstrategie die de onbedoelde exploratie-inzinking bij Large Reasoning Models na post-training oplost door het selecteren van dieptec configuraties met maximale entropie op basis van tussenlagen, waardoor de nauwkeurigheid op redeneerbenchmarks aanzienlijk verbetert.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Dit artikel presenteert een verzameling casestudies die aantonen hoe onderzoekers succesvol samenwerken met Google's Gemini-modellen om open problemen op te lossen, conjecturen te weerleggen en nieuwe bewijzen te genereren in theoretische informatica en aanverwante vakgebieden, waarbij effectieve technieken voor mens-AI-samenwerking worden geïdentificeerd.

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Towards Autonomous Mathematics Research

In dit artikel wordt Aletheia, een autonoom wiskundig onderzoekssysteem dat door iteratief genereren, verifiëren en reviseren van oplossingen in natuurlijke taal, geïntroduceerd om de overgang van olympiadeproblemen naar professioneel wiskundig onderzoek te maken, waarbij het zowel volledig door AI gegenereerde papers als mens-AI-samenwerkingen demonstreert.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Dit artikel bekritiseert de illusie van een objectieve 'ground truth' in dataannotatie door aan te tonen dat menselijke meningsverschillen vaak ten onrechte als ruis worden behandeld in plaats van als waardevolle signalen, en pleit voor pluralistische annotatie-infrastructuur die culturele diversiteit erkent in plaats van te onderdrukken.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque Ahmed2026-03-09🤖 cs.AI

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

Dit paper introduceert CoME, een nieuw mobiel agent-architectuur met gespecialiseerde experts en een progressieve trainingsstrategie die hybride redeneervaardigheden verbetert en foutpropagatie beperkt door middel van informatiewinst-gedreven DPO, wat leidt tot superieure prestaties op AITZ- en AMEX-datasets.

Yuxuan Liu, Weikai Xu, Kun Huang, Changyu Chen, Jiankun Zhao, Pengzhi Gao, Wei Liu, Jian Luan, Shuo Shang, Bo Du, Ji-Rong Wen, Rui Yan2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Dit paper introduceert een theoretisch raamwerk voor grammatica-gedwongen decoding dat bewijst dat taalkundig equivalente grammatica's weliswaar identieke toekenningsmasks opleveren, maar aanzienlijk verschillende computatiekosten kunnen veroorzaken door structurele ambiguïteit, en biedt bovendien onderbouwing voor het optimaliseren van grammatica's en het beperken van de distortie bij het maskeren van logits.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG