CelloAI Benchmarks: Toward Repeatable Evaluation of AI Assistants
本文针对现有基准无法反映高能物理(HEP)和高性能计算(HPC)领域约束的问题,提出了一套包含代码文档生成、GPU 内核代码生成及图形数据分析三个维度的可重复评估框架,旨在量化并推动大语言模型在科学计算辅助开发中的可靠性与性能。
1472 篇论文
肝外系统(Hep-Ex)研究聚焦于肝脏之外那些与肝脏功能紧密相连的复杂网络,涵盖从代谢调节到免疫反应的广泛领域。这里探讨的不仅是器官间的相互作用,更是理解全身健康如何受肝脏状态深远影响的关键窗口。
Gist.Science 每日从 arXiv 抓取该领域最新预印本,经过专业处理,为每一篇论文提供通俗易懂的解读与详尽的技术摘要。无论您是寻求直观概念的科学爱好者,还是需要深入细节的研究者,都能在此找到所需内容。
以下是该分类下从 arXiv 精选的最新研究成果。
本文针对现有基准无法反映高能物理(HEP)和高性能计算(HPC)领域约束的问题,提出了一套包含代码文档生成、GPU 内核代码生成及图形数据分析三个维度的可重复评估框架,旨在量化并推动大语言模型在科学计算辅助开发中的可靠性与性能。
该论文提出了一种基于信息论和费雪信息度量的新精细调节度,通过构建参数空间的黎曼几何结构来量化低能观测值对基本参数的敏感性,不仅自然推广了传统的 Barbieri-Giudice 判据,且在多个物理模型中展现出与物理直觉一致的行为。
本文针对 JUNO 实验中残留C 同位素导致的正电子能量分辨率受损问题,提出并评估了包括卷积模型和 Transformer 在内的多种深度学习模型,以实现对难以识别的C 堆积事件的有效甄别。
本文介绍了 ImpCresst,这是一款基于 Geant4 的蒙特卡洛模拟工具,专为 keV 能区的固态探测器设计,具备从 CAD 文件动态构建几何、自动元数据标注、独立于体积限制的放射性污染粒子生成器以及 HPC 环境下的工作流管理能力,旨在模拟自然与宇宙成因放射性核素背景及校准信号。
ATLAS 实验利用 2022 至 2024 年采集的 13.6 TeV 质子 - 质子对撞数据(对应 164 fb积分亮度),通过寻找包含至少一个位移顶点和一个位移μ子的事件来搜索大质量长寿命粒子,结果显示未发现显著超出背景的信号,并据此对 宇称破缺超对称模型等设定了 95% 置信水平下的截面上限。
该研究通过 GEANT4 模拟和 Sandford-Wang 参数化方法评估了中性π介子衰变产生的亚 GeV 暗物质,表明欧洲散裂源(ESS)、日本 J-PARC 和中国 CSNS 等未来低阈值相干弹性中微子 - 原子核散射实验将能够探测到现有直接探测实验难以触及的矢量门户暗物质参数空间。
该研究提出了量子神经网络的几何设计原则,通过引入几乎完全局部选择性(aCLS)准则,指出实现有效特征学习需具备数据与权重联合依赖的可控几何变形能力,从而将设计重点从状态可达性转向可学习的隐藏表示几何结构。
该研究提出并验证了一种利用超导量子比特将微波腔制备为非经典福克态()以通过受激发射增强暗物质信号的技术,使扫描速率提升了 2.78 倍,并据此在 5.965 GHz 频段排除了动能混合角 的暗光子参数空间。
该论文提出了一种通过探测宇宙背景中微子在原子或分子系统中诱导的相干参数荧光(即中微子散射并释放红外光子)来发现宇宙中微子背景的新方法,并指出在特定共振条件下,该过程的信号速率有望达到可观测水平。
该研究以 DUNE 实验为例,定量证明了最终态相互作用(FSI)建模的合理变化所导致的能谱畸变可能超过振荡参数变化的影响,从而引发参数简并,因此强调亟需通过理论驱动的不确定度参数化及新测量来改进 FSI 表征,以保障下一代长基线中微子实验的测量精度。