PRBench: End-to-end Paper Reproduction in Physics Research
本文介绍了 PRBench,这是一个由北京大学物理系专家构建的包含 30 个真实物理研究复现任务的基准,旨在评估大语言模型智能体在无需人工干预的情况下从理解论文到生成可验证结果的端到端科研能力,测试结果显示当前最强智能体仅得 34 分且无法成功完成任何完整复现任务,揭示了其在公式实现、调试及数据准确性方面的显著局限性。
450 篇论文
肝-拉丁美洲(Hep-Lat)领域聚焦于拉丁美洲高能物理研究的独特视角,这里汇聚了来自该地区科学家对宇宙基本粒子和相互作用的前沿探索。这些研究不仅填补了全球物理图谱的空白,也展现了多元文化背景下的科学创新活力。
Gist.Science 持续追踪 arXiv 平台上所有属于此分类的最新预印本。我们不仅提供详尽的技术解读,更将复杂的物理推导转化为通俗易懂的通俗语言摘要,让每一位读者都能轻松跨越专业门槛,洞察研究核心。
以下是该领域最新的论文列表,欢迎查阅。
本文介绍了 PRBench,这是一个由北京大学物理系专家构建的包含 30 个真实物理研究复现任务的基准,旨在评估大语言模型智能体在无需人工干预的情况下从理解论文到生成可验证结果的端到端科研能力,测试结果显示当前最强智能体仅得 34 分且无法成功完成任何完整复现任务,揭示了其在公式实现、调试及数据准确性方面的显著局限性。
该论文基于组分夸克模型和分子图像,系统计算了开重味与分子型五夸克八重态的磁矩,揭示了不同轻双夸克构型导致的磁矩显著差异及重味夸克味对称性破缺效应,为未来实验鉴别此类粒子的内部结构提供了关键电磁基准。
本文利用 RBC/UKQCD 合作组在 2+1 味规范系综上生成的格点数据,展示了在窄宽度近似下提取描述 衰变的四个形状因子的分析步骤。
该研究利用梯度流和微扰论匹配技术,在六组 RBC/UKQCD 2+1 味格点上首次完成了对描述重介子寿命比的四夸克算符袋参数的完整误差预算计算,并给出了\overline{\text{MS}}}方案下的精确数值结果。
该研究利用梯度流结合短流时间展开(GF+SFTX)方法,基于 RBC/UKQCD 格点数据精确计算了物理夸克质量下重介子混合与寿命相关的四夸克算符矩阵元及袋参数,并将其微扰匹配至方案,从而验证了该方法在处理幂次发散混合问题上的可靠性与高精度。
本文综述了近年来格点量子色动力学在强子结构计算方面的重大进展,特别是针对π介子、K介子和核子的电荷、形状因子及各类分布函数的计算结果,并阐述了这些理论成果如何为电子 - 离子对撞机(EIC)的科学议程提供关键支撑。
本文概述了世界体积混合蒙特卡洛(WV-HMC)方法的核心思想,并将其扩展至群流形,从而为将其应用于格点规范理论以解决数值符号问题提供了严谨框架。
本文通过分解交错费米子为马约拉纳分量并利用晶格平移对称性,在 3+1 维交错费米子哈密顿量中构造了一组守恒的非单态荷,证明了其在连续极限下生成轴手征 变换,并探讨了其反常效应。
该论文在威尔逊费米子框架下重构了 1+1 维格点理论中的轴荷算符,利用其具有整数手征性本征值的特性构建了保持精确轴对称性的哈密顿量,从而为在格点上实现手征规范理论及对称性质量生成(SMG)机制提供了新的理论框架。
本文介绍了利用保留部分超对称性的格点方法构建二维最大超对称杨 - 米尔斯理论,并通过扩展软件实现理性混合蒙特卡洛模拟,以研究其连续极限并检验规范 - 引力对偶。