Applied Explainability for Large Language Models: A Comparative Study
本文通过在 SST-2 情感分类任务上对集成梯度、注意力传播和 SHAP 三种可解释性技术进行对比研究,揭示了基于梯度的方法在稳定性和直观性上的优势,并强调了这些方法作为诊断工具而非绝对解释的实用价值与权衡。
原作者已查阅我们通俗解释的论文。
本页收录的每篇论文,都有至少一位原作者阅读并参与了我们的通俗解释——或是确认其准确无误,或是提出修正意见并由我们随后采纳。作者的确认并不等同于对每一句话的正式背书,但说明该解释已经过论文作者的审视。
607 篇论文已由作者审阅 · 451–460 / 607
本文通过在 SST-2 情感分类任务上对集成梯度、注意力传播和 SHAP 三种可解释性技术进行对比研究,揭示了基于梯度的方法在稳定性和直观性上的优势,并强调了这些方法作为诊断工具而非绝对解释的实用价值与权衡。
该研究通过统计分析与多尺度表征,揭示了基于外延 Hf₀.₅Zr₀.₅O₂ 的铁电忆阻器件中,横向尺寸调控了面积依赖的隧穿输运与局域导电通道两种机制的共存状态,并在约 10³ μm² 处呈现统计交叉,该交叉现象与铁电唤醒及氧空位重分布的起始相关联。
本研究利用甚大望远镜HAWK-I的深场测光数据测量了大质量恒星形成区M17中的原行星盘比例,发现尽管局部紫外辐射通量因动力学混合而与盘的存续无相关性,但与其他年龄相近区域的对比证实,外部光致蒸发显著缩短了原行星盘的平均寿命。
该论文提出了一种名为-FlowNet 的基于注意力机制 U-Net 的深度学习框架,通过利用计算流体力学生成数据进行训练,实现了对不规则微通道内复杂流场的高效、高精度预测与映射。
该论文证明,拥有真实且可精炼知识的理性主体无法通过内省或学习新事件来确知自己是否掌握了全部知识。
该论文通过研究零位移伦德勒楔形中的量子场,揭示了质量项破坏共形对称性会导致加速观测者所感知的粒子谱出现热性崩溃,从而使有质量场在该背景下呈现非热响应。
该研究通过在基于 Pygame 构建的 2D 自定义赛道环境中,利用车载 7 个传感器数据训练并评估了一种引入优先动作选择机制的改进型深度 Q 网络(DQN),结果显示其平均奖励比原始 DQN 和基础神经网络分别提升了约 60% 和 50%。
该研究利用美国 NHANES 数据发现,在不患糖尿病的成年人中,当前吸烟与较高的糖化血红蛋白(HbA1c)水平显著相关,而既往吸烟则无此关联,表明戒烟后该效应可能减弱。
该研究利用欧几里得望远镜快速数据发布(Q1)结合多波段数据,首次确认了低质量星系中存在 9 个双活动星系核候选体,为低质量星系中黑洞并合及引力波产生模型提供了关键观测证据。
该论文提出了一种面向轨迹的贝叶斯优化方法,通过将随机种子与输入参数共同作为高斯过程代理模型的输入,并结合自适应汤普森采样算法,显著提升了在随机模拟(如流行病模型)中高效发现与数据一致轨迹的能力。