Creating a Hybrid Rule and Neural Network Based Semantic Tagger using Silver Standard Data: the PyMUSAS framework for Multilingual Semantic Annotation

Dit paper introduceert het PyMUSAS-framework, dat een hybride aanpak combineert van regels en neurale netwerken voor meertalige semantische annotatie in het USAS-systeem, waarbij gebruik wordt gemaakt van een nieuw 'silver standard'-dataset om de prestaties te evalueren en te verbeteren.

Andrew Moore, Paul Rayson, Dawn Archer, Tim Czerniak, Dawn Knight, Daisy Lal, Gearóid Ó Donnchadha, Mícheál Ó Meachair, Scott Piao, Elaine Uí Dhonnchadha, Johanna Vuorinen, Yan Yabo, Xiaobin Yang2026-03-09💬 cs.CL

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Dit paper introduceert Latent Exploration Decoding (LED), een trainingsvrije decodingstrategie die de onbedoelde exploratie-inzinking bij Large Reasoning Models na post-training oplost door het selecteren van dieptec configuraties met maximale entropie op basis van tussenlagen, waardoor de nauwkeurigheid op redeneerbenchmarks aanzienlijk verbetert.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Dit artikel presenteert een verzameling casestudies die aantonen hoe onderzoekers succesvol samenwerken met Google's Gemini-modellen om open problemen op te lossen, conjecturen te weerleggen en nieuwe bewijzen te genereren in theoretische informatica en aanverwante vakgebieden, waarbij effectieve technieken voor mens-AI-samenwerking worden geïdentificeerd.

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Towards Autonomous Mathematics Research

In dit artikel wordt Aletheia, een autonoom wiskundig onderzoekssysteem dat door iteratief genereren, verifiëren en reviseren van oplossingen in natuurlijke taal, geïntroduceerd om de overgang van olympiadeproblemen naar professioneel wiskundig onderzoek te maken, waarbij het zowel volledig door AI gegenereerde papers als mens-AI-samenwerkingen demonstreert.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Dit artikel bekritiseert de illusie van een objectieve 'ground truth' in dataannotatie door aan te tonen dat menselijke meningsverschillen vaak ten onrechte als ruis worden behandeld in plaats van als waardevolle signalen, en pleit voor pluralistische annotatie-infrastructuur die culturele diversiteit erkent in plaats van te onderdrukken.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque Ahmed2026-03-09🤖 cs.AI

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

Dit paper introduceert CoME, een nieuw mobiel agent-architectuur met gespecialiseerde experts en een progressieve trainingsstrategie die hybride redeneervaardigheden verbetert en foutpropagatie beperkt door middel van informatiewinst-gedreven DPO, wat leidt tot superieure prestaties op AITZ- en AMEX-datasets.

Yuxuan Liu, Weikai Xu, Kun Huang, Changyu Chen, Jiankun Zhao, Pengzhi Gao, Wei Liu, Jian Luan, Shuo Shang, Bo Du, Ji-Rong Wen, Rui Yan2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Dit paper introduceert een theoretisch raamwerk voor grammatica-gedwongen decoding dat bewijst dat taalkundig equivalente grammatica's weliswaar identieke toekenningsmasks opleveren, maar aanzienlijk verschillende computatiekosten kunnen veroorzaken door structurele ambiguïteit, en biedt bovendien onderbouwing voor het optimaliseren van grammatica's en het beperken van de distortie bij het maskeren van logits.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Dit paper introduceert EigenData, een zelfevoluerend multi-agentplatform dat de volledige levenscyclus van function-calling data automatiseert en gebruikt om de Berkeley Function-Calling Leaderboard te auditeren en te repareren, wat resulteert in een betrouwbaardere evaluatie die beter correleert met menselijke oordelen over functionele correctheid.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed🤖 cs.AI