LatentLens: Revealing Highly Interpretable Visual Tokens in LLMs
本文介绍了 LatentLens,这是一种新颖的可解释性方法,它通过从文本语料库中进行最近邻检索,将视觉语言模型中的视觉标记表示映射为自然语言描述,证明了视觉标记在所有模型层中的可解释性都远高于以往通过 LogitLens 等方法所揭示的程度。
原作者已查阅我们通俗解释的论文。
本页收录的每篇论文,都有至少一位原作者阅读并参与了我们的通俗解释——或是确认其准确无误,或是提出修正意见并由我们随后采纳。作者的确认并不等同于对每一句话的正式背书,但说明该解释已经过论文作者的审视。
560 篇论文已由作者审阅 · 1–10 / 560
本文介绍了 LatentLens,这是一种新颖的可解释性方法,它通过从文本语料库中进行最近邻检索,将视觉语言模型中的视觉标记表示映射为自然语言描述,证明了视觉标记在所有模型层中的可解释性都远高于以往通过 LogitLens 等方法所揭示的程度。
本研究提出了一个技术-社会-经济框架,证明了南美洲的水上漂浮光伏(FSPV)系统为能源获取和水安全提供了一种土地高效且具成本竞争力的解决方案,并在尼加拉瓜、洪都拉斯和圭亚那等国具有与水电站及人工智能数据中心进行共址开发的巨大潜力。
本文通过对 2021 年狮子座 新星爆发的光谱能量分布进行建模,分析了其早期演化过程,揭示了由白矮星自转塑造的双极喷发结构,该结构促进了产生再处理辐射和伽马射线发射的内部冲击波。
本文通过利用避免了特征理论的有理群代数方法,证明了任何容纳此类集合的幂零群必为 -群,从而确立了非交换群中偏哈达玛(skew-Hadamard)差集的首个一般结构限制。
本文介绍了 KG-ER,这是一种旨在独立于特定底层数据表示来定义知识图谱结构与语义的概念模式语言。
通过使用改进的 AMPT 模型,本研究证明了合并机制对于准确重现 RHIC 中 Au+Au 碰撞中观察到的 比值增强现象至关重要,而仅靠碎裂过程则无法捕捉到这一趋势。
本文介绍了 Net-Ev,这是一种新型生成式模拟器,它利用结构引导的掩码预训练和拓扑感知扩散过程,根据自然语言输入生成真实的网络事件演化模拟,并通过一个新的多模态基准测试和拓扑感知评估指标进行了验证。
本文介绍了公平贝叶斯分类器,这是一种通过强制执行统计一致性和确定性,来确保所有人口统计子群组之间预测的一致性与透明性的方法,从而解决了频率主义方法中不成比例地影响少数群体群体的可靠性差距,同时保持或提高整体准确性。
本文介绍了 DSpinGNN,这是一种物理启发式的等变图神经网络,能够准确预测应变形单层 CrI 中的动态磁交换耦合,从而实现大规模模拟,揭示传统第一性原理方法无法触及的介观交换纹理和畴壁行为。
本文引入了一种新颖的基于分布的数学框架,该框架通过利用 KL 散度比较基序间距,来评估人类基因组组装在重复性着丝粒区域的准确性,从而为传统的序列比对方法提供了一种稳健的替代方案。