Development of an LLM-Based System for Automatic Code Generation from HEP Publications
本文提出并评估了一个基于大语言模型的证明概念系统,该系统能够从高能物理出版物中提取分析流程并自动生成可执行代码,旨在辅助复现物理结果,尽管目前仍面临幻觉和随机性等挑战,但已展现出作为人机协作工具的潜力。
332 篇论文
物理学中的数据分析和计算模拟正以前所未有的速度重塑我们对自然规律的理解。这一领域不再仅仅依赖传统的实验室测量,而是通过处理海量观测数据,揭示出宇宙从微观粒子到宏观星系中隐藏的复杂模式。
在 Gist.Science,我们直接从 arXiv 获取该领域的最新预印本,并为您精心处理每一份新发布的论文。无论是通俗易懂的科普解读,还是深入严谨的技术摘要,我们都致力于让前沿的物理数据分析成果变得触手可及。
下方为您呈现该分类下最新的精选论文,助您快速把握数据驱动物理学的最新脉搏。
本文提出并评估了一个基于大语言模型的证明概念系统,该系统能够从高能物理出版物中提取分析流程并自动生成可执行代码,旨在辅助复现物理结果,尽管目前仍面临幻觉和随机性等挑战,但已展现出作为人机协作工具的潜力。
本文介绍了 NOMAI,这是一种部署于 Fink 中介系统中的实时机器学习分类器,它利用基于物理模型的光度特征从 ZTF 巡天数据中高效识别超亮超新星候选体,并在试运行期间成功恢复了绝大多数已知目标,为未来 Rubin 天文台的大规模时域巡天奠定了基础。
该论文利用功能重整化群框架,通过定义标度依赖的“规范维度”作为序参量,揭示了在信噪比显著低于传统 BBP 阈值时发生的“维度相变”,从而为检测几乎连续谱中信号引起的谱密度几何变形提供了一种新的有效方法。
该论文提出了一种结合注意力机制模拟检索与随机生成的多站点洪水模拟框架,能够生成考虑年际至年代际气候变率的时空相干洪水情景,从而填补了现有工具在评估非平稳级联洪水风险以支持保险与金融规划方面的关键空白。
该论文通过全面比较 Fisher 矩阵、传统 MCMC 及导数近似似然法(DALI),证实了 DALI 方法能以显著更低的计算成本实现高精度的引力波参数后验推断,并发布了集成自动微分等先进功能的开源代码 GWDALI v1.0。
本文提出了一种基于末态强子不变质量()的新型中微子能量估算器,旨在解决液氩时间投影室(LArTPC)在浅层与深层非弹性散射过渡区的测量挑战,研究发现该估算器在应对模型失配时具有最小的偏差和卓越的稳定性,尽管其能量分辨率略逊于理想模型下的其他方法,但为未来 LArTPC 振荡分析中多种估算器的联合使用提供了重要依据。
本文利用氪 -83 同位素衰变产生的电子和光子事件数据,系统比较了包括海林格距离、沃瑟斯坦距离等在内的多种统计距离度量及归一化函数,评估了参数估计在不同样本量、离散化长度和归一化条件下的稳定性,并提出了归一化函数应具备的性质。
该研究通过对比分析发现,作用于膜电位的乘性噪声对脉冲神经网络性能损害最大,而采用 Sigmoid 预滤波策略将输入限制为正区间后,输入电流中的加性噪声成为主要干扰源,且网络对常见噪声表现出更强的鲁棒性。
该论文提出了一种名为“精确 - 近似马尔可夫链蒙特卡洛”的新方法,通过引入无偏泊松似然估计量,使得在利用含噪蒙特卡洛模拟进行对撞机物理(如超对称粒子搜索)分析时,能够以与现有近似方法相当的计算成本获得精确的统计推断结果。
该研究表明,在多种高能碰撞数据上预训练的 OmniLearned 基础模型能够有效迁移至几 GeV 能区的固定靶中微子实验,在能量回归和末态分类任务中均优于从头训练的模型,证明了粒子物理基础模型具备跨越能量尺度、探测器技术和物理过程的泛化能力。