Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection
该论文提出了名为 DIRECTER 的新方法,通过结合注意力敏感性分析与基于合理性的解码循环,动态调节激活引导强度,从而在无需额外数据集的情况下有效缓解大语言模型的过度引导问题,显著提升了指令遵循能力且未牺牲生成质量。
4376 篇论文
该论文提出了名为 DIRECTER 的新方法,通过结合注意力敏感性分析与基于合理性的解码循环,动态调节激活引导强度,从而在无需额外数据集的情况下有效缓解大语言模型的过度引导问题,显著提升了指令遵循能力且未牺牲生成质量。
本文提出了 ButterflyViT,一种通过将专家视为共享量化基底的几何重定向并引入空间平滑正则化来解决线性内存扩展瓶颈的方法,从而在 CIFAR-100 等任务上实现了 64 专家配置下 354 倍的内存压缩且精度损失可忽略,使稀疏混合专家视觉 Transformer 能够部署于边缘设备。
本文提出了 ProtAlign 框架,通过多目标偏好对齐策略微调预训练逆折叠模型,在保持结构可设计性的同时,有效平衡了蛋白质序列设计中溶解度、热稳定性等多种开发属性。
这篇论文全面综述了机器人基础模型(RFM)的工业适用性,提出了包含 149 项具体标准的评估框架,并通过大规模评估发现当前 RFM 在工业领域的成熟度有限且发展不均衡,强调未来的进步应依赖于将安全、实时性、鲁棒感知及系统集成等要素系统性地纳入可审计的部署堆栈中。
本文提出了一种名为 XMACNet 的可解释轻量级注意力 CNN 模型,通过融合可见光图像与植被指数并引入 StyleGAN 数据增强,在辣椒病害分类任务中实现了高精度、强可解释性及边缘部署能力。
该论文提出了一种名为 ICD3 的无偏聚类描述符方法,通过多分布粒度搜索识别不平衡概念并分别训练单类分类器,从而有效克服了主导大簇对少数小概念漂移的“掩蔽效应”,实现了可解释且鲁棒的不平衡概念漂移检测。
该论文提出了一种多层次可解释性框架,通过在 NACC 数据集上整合多种指标,验证了 SHAP 方法在阿尔茨海默病诊断与预后模型中跨任务、跨阶段及跨架构的解释具有高度的一致性与稳定性,从而增强了临床应用的可靠性。
本文提出了一种基于梯度的嵌套共设计框架,通过结合最优控制规划器与神经代理气动模型,实现了对固定翼滑翔机气动外形与控制策略的联合优化,从而在显著缩短计算时间的同时,有效提升了其在复杂动态任务(如停栖和短距着陆)中的性能。
该论文提出了一种基于稀疏 QUBO 优化和混合核心集构建的多样性感知自适应配点方法,通过从候选池中筛选兼具高信息量与低冗余度的点集,有效解决了物理信息神经网络(PINNs)在训练效率与精度上的瓶颈问题。
本文提出了一种基于符号机器学习的故障预测方法,通过利用化学过程模拟器生成的数据,在乙烯氧化案例中证明了该方法在保持模型可解释性的同时,其性能优于随机森林和多层感知机等基线模型,并探讨了其在辅助化工操作员决策中的应用潜力。
本文提出了一种基于异构图 Transformer 的强化学习调度框架(HGT-Scheduler),通过将作业车间调度问题建模为异构图并利用边类型感知的注意力机制来捕捉不同的关系语义,从而在 Fisher-Thompson 基准测试中显著提升了调度策略的性能。
SpatialMAGIC 是一种结合图扩散与空间自注意力机制的混合框架,旨在解决空间转录组数据的高稀疏性和技术噪声问题,通过有效恢复缺失表达值并保留空间一致性,在聚类精度和下游生物分析中显著优于现有基准方法。
本文介绍了名为 xaitimesynth 的 Python 开源包,旨在通过生成带有已知真实标签的合成时间序列数据,为评估时间序列归因方法提供可复用、灵活且可复现的基础设施及标准评估指标。
该论文提出了一种基于 Context-UNet 架构的物理信息扩散模型,通过结合关键大气参数条件生成具有物理一致性的多光谱卫星图像合成数据,有效解决了热带气旋快速增强等极端罕见气象事件样本稀缺及类别不平衡问题,从而提升了气象检测算法的鲁棒性。
本文提出了乐观策略正则化(OPR)方法,通过维护高绩效轨迹的动态缓冲区并利用方向性对数比率奖励塑造及辅助行为克隆目标来防止策略过早收敛,从而在 Atari 游戏和 CAGE 网络安全挑战中显著提升了样本效率与最终性能。
该论文提出了一种名为 Best-of-Tails (BoT) 的自适应推理时对齐框架,通过利用 Hill 估计器动态识别奖励分布的尾部特征,并借助 Tsallis 散度在“乐观”的 Best-of-N 策略与“悲观”的正则化方法之间进行自适应权衡,从而有效解决了大语言模型对齐中奖励黑客与探索不足之间的根本矛盾。
该论文提出了 AceMAD 框架,通过利用真理持有者能预判群体错误而幻觉多数者无法察觉的认知势能不对称性,将多智能体辩论从易陷入错误共识的“鞅诅咒”随机游走转化为具有正向漂移的定向收敛过程,从而在初始多数意见错误时仍能准确提取稀疏的真实信号。
该论文提出了一种结合 VGG19、Efficient-Net 和 ResNet50 提取特征并由 Bi-LSTM 进行分类的混合机器学习模型,用于基于新生儿脑部 MRI 图像早期检测脑瘫,其 98.83% 的准确率优于多个单独使用的预训练模型。
该论文针对当前 AI 评估方法难以反映实际运营现状的问题,提出了“情境规范”(context specification)这一流程,旨在将模糊的利益相关者视角转化为明确的可测量构念,从而为组织在真实部署环境中制定明智的 AI 决策和评估提供基础路线图。
该论文指出,在去中心化多智能体强化学习中,由于将同伴策略纳入世界边界会引发非平稳性,导致跨回合的不变决策核心(Invariant Core)可能收缩或消失,从而将此类问题重新定义为一种源于“智能体 - 世界”边界漂移的持续学习挑战。