FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Dit paper introduceert FATE, een nieuwe reeks formele algebra-benchmarks met problemen die variëren van undergraduate-oefeningen tot PhD-niveau, om de aanzienlijke kloof tussen de huidige prestaties van grote taalmodellen in wiskundig redeneren en het niveau van modern wetenschappelijk onderzoek in kaart te brengen.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin DongTue, 10 Ma🤖 cs.LG

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Dit paper introduceert een theoretisch raamwerk voor grammatica-gedwongen decoding dat bewijst dat taalkundig equivalente grammatica's weliswaar identieke toekenningsmasks opleveren, maar aanzienlijk verschillende computatiekosten kunnen veroorzaken door structurele ambiguïteit, en biedt bovendien onderbouwing voor het optimaliseren van grammatica's en het beperken van de distortie bij het maskeren van logits.

Faruk Alpay, Bilge SenturkMon, 09 Ma🤖 cs.LG

Risk-Aware Autonomous Driving with Linear Temporal Logic Specifications

Deze paper introduceert een risicobewuste aanpak voor autonoom rijden die lineaire temporale logica (LTL) specificeert met timing en ernst, waardoor een lineair programmeringsprobleem wordt geformuleerd dat het synthetiseren van besturingsbeleid mogelijk maakt dat verschillende risico's, zoals botsingen en verkeersovertredingen, op een menselijke manier in evenwicht brengt.

Shuhao Qi, Zengjie Zhang, Zhiyong Sun + 1 more2026-03-06💻 cs

Classification of Local Optimization Problems in Directed Cycles

Dit artikel presenteert een volledige classificatie van de gedistribueerde complexiteit voor lokale optimalisatieproblemen in gerichte cycli, waarbij het aantoont dat de complexiteit voor zowel deterministische als probabilistische modellen valt binnen één van vier specifieke klassen en dat deze klasse automatisch kan worden bepaald en een optimale algoritme kan worden gegenereerd.

Thomas Boudier, Fabian Kuhn, Augusto Modanese + 2 more2026-03-06💻 cs