XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification
本文提出了一种名为 XMACNet 的可解释轻量级注意力 CNN 模型,通过融合可见光图像与植被指数并引入 StyleGAN 数据增强,在辣椒病害分类任务中实现了高精度、强可解释性及边缘部署能力。
4352 篇论文
本文提出了一种名为 XMACNet 的可解释轻量级注意力 CNN 模型,通过融合可见光图像与植被指数并引入 StyleGAN 数据增强,在辣椒病害分类任务中实现了高精度、强可解释性及边缘部署能力。
该论文提出了一种名为 ICD3 的无偏聚类描述符方法,通过多分布粒度搜索识别不平衡概念并分别训练单类分类器,从而有效克服了主导大簇对少数小概念漂移的“掩蔽效应”,实现了可解释且鲁棒的不平衡概念漂移检测。
该论文提出了一种多层次可解释性框架,通过在 NACC 数据集上整合多种指标,验证了 SHAP 方法在阿尔茨海默病诊断与预后模型中跨任务、跨阶段及跨架构的解释具有高度的一致性与稳定性,从而增强了临床应用的可靠性。
本文提出了一种基于梯度的嵌套共设计框架,通过结合最优控制规划器与神经代理气动模型,实现了对固定翼滑翔机气动外形与控制策略的联合优化,从而在显著缩短计算时间的同时,有效提升了其在复杂动态任务(如停栖和短距着陆)中的性能。
该论文提出了一种基于稀疏 QUBO 优化和混合核心集构建的多样性感知自适应配点方法,通过从候选池中筛选兼具高信息量与低冗余度的点集,有效解决了物理信息神经网络(PINNs)在训练效率与精度上的瓶颈问题。
本文提出了一种基于符号机器学习的故障预测方法,通过利用化学过程模拟器生成的数据,在乙烯氧化案例中证明了该方法在保持模型可解释性的同时,其性能优于随机森林和多层感知机等基线模型,并探讨了其在辅助化工操作员决策中的应用潜力。
本文提出了一种基于异构图 Transformer 的强化学习调度框架(HGT-Scheduler),通过将作业车间调度问题建模为异构图并利用边类型感知的注意力机制来捕捉不同的关系语义,从而在 Fisher-Thompson 基准测试中显著提升了调度策略的性能。
SpatialMAGIC 是一种结合图扩散与空间自注意力机制的混合框架,旨在解决空间转录组数据的高稀疏性和技术噪声问题,通过有效恢复缺失表达值并保留空间一致性,在聚类精度和下游生物分析中显著优于现有基准方法。
本文介绍了名为 xaitimesynth 的 Python 开源包,旨在通过生成带有已知真实标签的合成时间序列数据,为评估时间序列归因方法提供可复用、灵活且可复现的基础设施及标准评估指标。
该论文提出了一种基于 Context-UNet 架构的物理信息扩散模型,通过结合关键大气参数条件生成具有物理一致性的多光谱卫星图像合成数据,有效解决了热带气旋快速增强等极端罕见气象事件样本稀缺及类别不平衡问题,从而提升了气象检测算法的鲁棒性。
本文提出了乐观策略正则化(OPR)方法,通过维护高绩效轨迹的动态缓冲区并利用方向性对数比率奖励塑造及辅助行为克隆目标来防止策略过早收敛,从而在 Atari 游戏和 CAGE 网络安全挑战中显著提升了样本效率与最终性能。
该论文提出了一种名为 Best-of-Tails (BoT) 的自适应推理时对齐框架,通过利用 Hill 估计器动态识别奖励分布的尾部特征,并借助 Tsallis 散度在“乐观”的 Best-of-N 策略与“悲观”的正则化方法之间进行自适应权衡,从而有效解决了大语言模型对齐中奖励黑客与探索不足之间的根本矛盾。
该论文提出了 AceMAD 框架,通过利用真理持有者能预判群体错误而幻觉多数者无法察觉的认知势能不对称性,将多智能体辩论从易陷入错误共识的“鞅诅咒”随机游走转化为具有正向漂移的定向收敛过程,从而在初始多数意见错误时仍能准确提取稀疏的真实信号。
该论文提出了一种结合 VGG19、Efficient-Net 和 ResNet50 提取特征并由 Bi-LSTM 进行分类的混合机器学习模型,用于基于新生儿脑部 MRI 图像早期检测脑瘫,其 98.83% 的准确率优于多个单独使用的预训练模型。
该论文针对当前 AI 评估方法难以反映实际运营现状的问题,提出了“情境规范”(context specification)这一流程,旨在将模糊的利益相关者视角转化为明确的可测量构念,从而为组织在真实部署环境中制定明智的 AI 决策和评估提供基础路线图。
该论文指出,在去中心化多智能体强化学习中,由于将同伴策略纳入世界边界会引发非平稳性,导致跨回合的不变决策核心(Invariant Core)可能收缩或消失,从而将此类问题重新定义为一种源于“智能体 - 世界”边界漂移的持续学习挑战。
本研究利用人工智能辅助技术,构建了涵盖 2005 至 2026 年社会社会工作与研究学会(SSWR)会议近 2.4 万篇摘要的数据库,揭示了该领域在作者协作、国际参与度及研究方法(以定量为主)等方面的显著演变趋势。
该论文提出将人类“黑暗三角”人格(自恋、精神病态和马基雅维利主义)作为研究人工智能对齐问题的模型,并通过实证研究发现,仅需对前沿大语言模型进行极小规模的针对性微调,即可诱导出与人类反社会行为高度一致的虚假人格,且模型能展现出超越训练数据的泛化推理能力。
该论文揭示了一种长程视觉语言模型的行为规律,即模型在推理过程中保持与视觉状态一致的时间锚定能力(通过步级接地率 SGR 衡量),是预测其分布外泛化性能的关键指标,且该能力独立于模型规模和最终答案准确率。
本文介绍了名为 Twitch 的工具,该工具利用 Stitch 自动从部分失败证明或相关定理的成功证明中发现等式定理证明中有用的抽象模式,并通过扩展 Twee 求解器,在 TPTP 单位等式问题上实现了 12 个难度为 1 的问题证明及显著的速度提升。