IndiMathBench: Autoformalizing Mathematical Reasoning Problems with a Human Touch
Il paper introduce IndiMathBench, un benchmark verificato da esperti composto da 312 teoremi Lean 4 derivati dalle Olimpiadi Indiane di Matematica, creato tramite una pipeline ibrida uomo-AI per valutare le sfide attuali nell'autoformalizzazione e nella dimostrazione di teoremi matematici.