Machine Learning for Stress Testing: Uncertainty Decomposition in Causal Panel Prediction
该论文提出了一种用于压力测试的机器学习框架,通过迭代回归、有界混淆下的因果集识别、递归 rollout 误差界及重要性加权共形校准,将预测不确定性分解为估计不确定性和混淆不确定性,从而在无需控制组的情况下实现透明且稳健的政策路径反事实推断。
11697 篇论文
该论文提出了一种用于压力测试的机器学习框架,通过迭代回归、有界混淆下的因果集识别、递归 rollout 误差界及重要性加权共形校准,将预测不确定性分解为估计不确定性和混淆不确定性,从而在无需控制组的情况下实现透明且稳健的政策路径反事实推断。
本文提出了 HLER(人机协同经济研究)多智能体架构,通过引入数据集感知假设生成、双循环优化机制及关键节点的人工决策,在确保人类监督的前提下实现了经济实证研究的自动化与可扩展性。
本文提出了 Dial,一种基于知识的地域特定 NL2SQL 系统,通过引入方言感知逻辑查询规划、分层意图知识基以及执行驱动的调试验证循环,有效解决了现有方法在处理异构数据库方言时语义正确性与可执行性不足的问题,并在新构建的 DS-NL2SQL 基准测试中显著提升了翻译准确率与方言特性覆盖率。
本文提出了 Backdoor4Good (B4G) 框架,将传统被视为安全威胁的“后门”机制重新定义为一种可控且可审计的接口,通过统一的三元组形式化方法在大型语言模型中实现了提升安全性、可控性和问责制的良性应用基准。
本文全面综述了过去十年图像生成领域的技术演进,系统梳理了从变分自编码器、生成对抗网络到扩散模型等主流架构的原理、优化与局限,并进一步探讨了视频生成、模型鲁棒性及负责任部署等关键议题。
该研究通过访谈和调查揭示了自由职业者与雇主在人工智能使用披露上存在显著的认知差距(从业者倾向于被动披露,而雇主更希望主动披露)以及因缺乏明确政策导致的期望误解,从而呼吁制定更清晰的披露指南以重建信任。
该论文提出了一种结合系统建模、攻击防御树及 CVSS 评分的目标驱动风险评估框架,旨在解决大语言模型系统安全分析碎片化问题,并通过医疗案例证明该框架能有效识别关键攻击路径并指导针对性防御。
本文提出了双流 Transformer 架构,通过将残差流解耦为分别由注意力机制和前馈网络更新的双流结构,并引入可调节的混合策略,在仅造成极小性能损失(推荐策略为 2.5%)的同时显著提升了语言模型的内部可解释性。
该论文提出了一种以人类感知难度为核心的分布外(OOD)谱系框架,通过量化刺激偏离程度来重新定义挑战等级,从而在不同难度区间内更精准地评估了各类深度学习模型(如 CNN、ViT 及视觉 - 语言模型)与人类在错误模式上的一致性。
该论文提出了一种通过自监督训练更新低秩适配器来微调冻结骨干网络的轻量级框架,仅需更新不到 1% 的参数即可在动态声学场景中实现高效的语音增强模型自适应,显著提升了模型在复杂噪声环境下的鲁棒性与感知质量。
该研究提出了一种基于条件扩散变换器的框架,利用 Hi-C 接触图谱引导生成具有高度构象多样性的*大肠杆菌*三维基因组结构集合,从而解决了传统方法仅能产生单一确定性结构的局限性。
该论文通过大规模实证分析揭示了基于模型上下文协议(MCP)的 AI 系统因缺乏调用者身份验证及细粒度授权机制,导致“一次授权、永久信任”的架构存在严重安全隐患,使得攻击者可能利用身份混淆绕过安全控制。
该研究表明,在视觉 - 语言模型中,即使完全移除训练数据中的显式超类证据,预训练语言模型仍能利用语言线索和视觉输入的一致性,成功恢复并泛化出物体的超类知识。
该论文提出了通过架构流独立性(即保持符号结构与上下文语义在独立流中处理直至输出融合)来“按设计实现可解释性”的新范式,并通过晚融合架构(LFA)验证了该方法能有效防止信息过早纠缠、提升模型稳定性,从而将可解释性确立为一种可通过结构约束强制实现的架构设计准则。
该论文提出了一种针对临床文本概念识别、断言分类和关系抽取的端到端联合神经网络基线模型,通过定义联合任务设置并采用多种嵌入技术,显著超越了传统的流水线基线方法,为未来相关研究提供了强有力的基准。
该论文针对大语言模型驱动的智能体从被动工具向自主实体演变所引发的安全挑战,提出了将安全划分为认知、执行和集体三个层级的“层级自主演化(HAE)”框架,系统梳理了威胁分类并指出了现有防御的不足,旨在为构建可信的多层自主防御架构提供指导。
SeDa 是一个统一框架,通过整合来自 200 多个平台的 760 多万份数据集,利用语义标准化、主题标签图及多实体增强导航策略,解决了跨源数据发现碎片化问题,实现了比现有平台更优越的覆盖度、时效性和可追溯性。
本文通过利用 Tweedie 公式,精确揭示了漂移模型(Drifting)与基于分数的扩散模型之间的内在联系,证明了高斯核漂移等价于在平滑分布上进行分数匹配,并进一步推导了通用径向核的分解形式及拉普拉斯核在低温和高维情形下的误差界,从而为理解漂移模型与分布匹配蒸馏(DMD)提供了统一的理论视角。
本文提出了 InterReal 框架,这是一个统一的基于物理的模仿学习系统,通过引入带接触约束的运动数据增强方案和自动奖励学习机制,实现了人形机器人对真实世界人机交互(HOI)技能的高效学习与鲁棒部署。
该论文提出了一种名为 SketchGraphNet 的混合图神经网络架构,通过结合局部消息传递与内存高效的全局注意力机制,在无需辅助编码的情况下直接处理大规模手绘草图图结构,并构建了包含 344 万样本的 SketchGraph 基准数据集,实现了高精度识别并显著降低了显存占用与训练时间。