TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning
O artigo apresenta o TikZilla, um conjunto de modelos de linguagem de pequeno porte treinados com o novo dataset de alta qualidade DaTikZ-V4 e um pipeline de aprendizado por reforço que utiliza recompensas semânticas baseadas em imagens, superando modelos proprietários maiores na geração de gráficos científicos em TikZ a partir de descrições textuais.