PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

本文介绍了 PolyBlocks,这是一个基于 MLIR 的模块化编译器基础设施,通过组合轻量级仿射分析与启发式成本模型自动执行多级分块、融合及算子映射等优化,实现了从高层框架到特定 AI 芯片的高效代码生成,并在 NVIDIA GPU 上的实验表明其性能可媲美甚至超越 Torch Inductor 和 XLA。

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab DuttaTue, 10 Ma🤖 cs.LG

Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using F2\mathbb{F}_2

本文提出了名为“线性布局”的新方法,通过利用F2\mathbb{F}_2上的线性代数将张量布局建模为二进制矩阵,从而实现了通用且高效的布局定义与转换,显著降低了 Triton 编译器后端的工程复杂度并提升了张量计算性能。

Keren Zhou, Mario Lezcano, Adam Goucher, Akhmed Rakhmati, Jeff Niu, Justin Lebar, Pawel Szczerbuk, Peter Bell, Phil Tillet, Thomas Raoux, Zahi MoudallalMon, 09 Ma💻 cs

Hybrid Structured Editing: Structures for Tools, Text for Users

该论文提出了“混合结构化编辑”方法,旨在通过为工具开发者提供结构约束保障、同时为用户维持熟悉的文本编辑界面,解决现有扩展机制难以将工具与文本源代码紧密集成及在编辑中追踪程序结构的问题。

Tom Beckmann (Hasso Plattner Institute, Germany / University of Potsdam, Germany), Christoph Thiede (Hasso Plattner Institute, Germany / University of Potsdam, Germany), Jens Lincke (Hasso Plattner Institute, Germany / University of Potsdam, Germany), Robert Hirschfeld (Hasso Plattner Institute, Germany / University of Potsdam, Germany)Mon, 09 Ma💻 cs

Evaluating LLMs in the Context of a Functional Programming Course: A Comprehensive Study

本文通过构建包含代码生成、修复和解释的三大基准测试,评估了九种先进大语言模型在低资源函数式编程语言 OCaml 教学环境中的表现,发现尽管其解决作业问题的成功率低于在 Python 和 Java 等主流语言上的表现,但在修正语法类型错误及解答基础概念问题上仍具有显著效用,并提出了旨在提升模型能力、引导学生认知局限及推动领域特定推理研究的未来方向。

Yihan Zhang (McGill University, Canada), Brigitte Pientka (McGill University, Canada), Xujie Si (University of Toronto, USA)Mon, 09 Ma💻 cs