Actionable Interpretability Must Be Defined in Terms of Symmetries
本文认为,可操作的 AI 可解释性必须通过四种特定的对称性进行形式化定义,这些对称性使得将可解释模型作为能够统一推理、对齐与安全合规性的概率系统的一个子类进行严谨的测试、设计与验证成为可能。
479 篇论文
从元素周期表中的钪(Cs)到氖(Ne),这一跨度涵盖了多种在材料科学与化学领域至关重要的元素。这些元素往往扮演着从半导体核心到精密催化剂的关键角色,深刻影响着我们对物质世界的理解与技术创新。
在 Gist.Science,我们致力于让 arXiv 上最新发布的关于这些元素的预印本论文变得触手可及。我们团队会持续追踪并处理该类别下的每一份新论文,不仅提供详尽的技术摘要,还特别撰写通俗易懂的通俗解读,帮助不同背景的研究者与爱好者轻松掌握前沿动态。
以下是本类别下最新收录的论文列表,带您即刻探索从基础理论到实际应用的全新发现。
本文认为,可操作的 AI 可解释性必须通过四种特定的对称性进行形式化定义,这些对称性使得将可解释模型作为能够统一推理、对齐与安全合规性的概率系统的一个子类进行严谨的测试、设计与验证成为可能。
本文介绍了一种生物学精确且具有机制性的多层神经网络模型,该模型能够实现高效的在线学习,作为反向传播算法的一种实用的替代方案,并在图像分类任务中展示了具有竞争力的性能。
本文引入了一种统一的算子演算框架,该框架将多种基于种群的优化方法建模为作用于概率测度的变异、选择和重组算子的复合,从而通过输运-反应-跳跃偏微分方程极限,实现了模块化的李雅普诺夫收敛分析。
本文提出了一种带有热启动策略的信息几何双层优化框架,以有效处理黑盒优化中强烈的类别-连续变量交互作用,并证明了其相较于现有最先进方法具有更优越的性能和计算效率。
本文介绍了 MP3,一种新颖的即插即用预训练插件,它利用多周期模式学习来解决时空预测中的“时间幻象”挑战,显著提升了现有图神经网络模型在不同真实世界数据集上的性能和适应性。
该论文提出了 A2SG,这是一个采用自适应且非对称代理梯度的统一框架,旨在通过减少梯度变化和损失函数曲率来解决深度脉冲神经网络中的训练挑战,从而在多种模型和任务中持续提高准确性和能量效率。
本立场论文认为,整合类海马体的显式记忆系统对于推动大语言模型向通用人工智能迈进至关重要,因为诸如战略规划和元认知等高阶认知功能,无法仅从目前作为大语言模型底层机制的隐式统计学习中涌现出来。
本文介绍了“My Chemical Harness”,这是一种路径原生的进化框架,它利用大语言模型作为高层策略控制器,引导从构建模块到可执行合成路径的构建,从而在不产生幻觉或无需模型微调的情况下,实现了最先进的分子设计性能。
本文提出了一种“固定查询振荡器注意力”(fixed-query oscillator attention),这是一种旨在替代 Softmax 的硬件高效方案,它利用耦合振荡器网络中的库拉莫托(Kuramoto)同步动力学,通过物理平衡来实现注意力机制,在证明其在能量受限基质上具有竞争力的性能的同时,也为物理人工智能提供了一个具有数学依据的蓝图。