Online unsupervised Hebbian learning in deep photonic neuromorphic networks
该研究提出并实验验证了一种基于非易失性相变材料突触和全光域局部反馈机制的深层光子神经网络,实现了无需光电转换的在线无监督赫布学习,并在字母识别任务中达到了100%的准确率。
11404 篇论文
该研究提出并实验验证了一种基于非易失性相变材料突触和全光域局部反馈机制的深层光子神经网络,实现了无需光电转换的在线无监督赫布学习,并在字母识别任务中达到了100%的准确率。
本文提出了 ZK-HybridFL,一种结合有向无环图账本、侧链与零知识证明的联邦学习框架,通过隐私保护验证和抗攻击机制,在提升模型收敛速度与准确率的同时,实现了高效、安全的去中心化协作训练。
该论文提出通过大语言模型生成过程中熵值的动态演化轨迹(而非静态聚合统计)来诊断推理错误,并据此构建了熵动态不稳定性评分(EDIS),有效提升了推理时的选择准确率及训练数据的筛选效果。
该论文指出大推理模型在强化学习后训练中出现了探索崩溃现象,并提出了无需额外训练或参数的“潜在探索解码”(LED)方法,通过聚合中间层后验分布并选择熵最大的深度配置,有效提升了模型在多个推理基准上的准确率。
该论文通过构建自动红队管道,首次证实了存在能够欺骗现有黑盒与白盒对齐审计方法的激活级战略欺骗策略,表明当前审计手段在面对具备足够能力的对齐失效模型时缺乏鲁棒性。
本文提出了 LaPha 方法,通过在庞加莱潜在空间中利用负曲率特性构建树状搜索并定义基于测地线距离的节点势能,实现了 AlphaZero 类 LLM 代理的高效训练与自引导测试时扩展,在 MATH-500 和 AIME 等数学基准测试中显著提升了模型性能。
该论文提出了一种基于扰动和数据集感知的验证协议,用于在 siRNA 疗效预测中评估可解释性(显著性图)的可靠性,揭示了现有模型在跨数据集部署时可能存在的“忠实但错误”或“显著性倒置”等失效模式,并引入生物先验正则化(BioPrior)以增强显著性图的忠实度,从而为解释引导的治疗设计确立了必要的预部署验证实践。
本文介绍了名为 Aletheia 的自主数学研究智能体,它通过结合先进推理模型、推理时扩展定律及工具使用能力,实现了从奥林匹克竞赛题到生成无人类干预研究论文、证明新定理及解决开放问题等里程碑式的 AI 辅助数学研究突破。
该论文通过推导时间注意力层雅可比矩阵的敏感度界限,揭示了时间注意力机制中存在对角线注意力汇聚(diagonal attention sink)现象及其对序列长度的依赖,并提出了相应的正则化方法以缓解时空信息退化问题。
该论文提出了 SWE-MiniSandbox,一种利用内核级机制和轻量级环境预缓存技术实现的无容器强化学习框架,它在保持隔离性的同时显著降低了磁盘占用和环境准备时间,为软件工程智能体的规模化训练提供了高效且可访问的基础。
本文介绍了 MiDAS,这是一个开源且与平台无关的多模态数据采集系统,它能够在无需专有机器人接口的情况下,通过非侵入式方式实现手术机器人(如 Raven-II 和 da Vinci Xi)的时间同步多模态数据采集,并发布了包含疝修补缝合任务的首个多模态数据集。
本文提出了 AHSIV 框架,通过整合考虑预测视界退化的指标调整、需求结构分类及多目标优化机制,解决了多 SKU 场景下因预测视界变化导致的模型排序不稳定问题,为异构需求环境下的业务决策提供了自适应且可复现的模型选择方案。
GaiaFlow 是一个创新的语义引导扩散微调框架,它通过结合检索引导的朗之万动力学、硬件无关性能建模、自适应早退机制及精度感知量化推理,在保持检索精度的同时显著降低了大规模神经搜索系统的碳足迹,实现了效果与能效的卓越平衡。
本文提出了 MolCrystalFlow,这是一种基于流匹配的生成模型,通过将分子视为刚体并在黎曼流形上联合学习晶格、取向和质心位置,成功解决了分子晶体结构预测中分子内复杂性与分子间堆积的解耦难题,为数据驱动的分子晶体发现开辟了新途径。
该论文通过系统性评估发现,尽管大语言模型在智能体工作流中表现出较强的代码修复能力,但这主要源于任务分解而非真正的长上下文推理,当面对 64k 真实长上下文时,模型性能显著下降并出现系统性错误,揭示了当前模型名义上下文长度与实际可用推理能力之间存在巨大差距。
本文提出了 FLoRG 框架,通过聚合单个低秩矩阵的 Gram 矩阵并结合 Procrustes 对齐技术,有效解决了联邦微调中 LoRA 方法存在的聚合误差与分解漂移问题,在显著提升下游任务精度的同时大幅降低了通信开销。
本文提出了 CoSiNE 模型,通过结合深度神经网络的表达能力与连续时间马尔可夫链的进化动力学,有效捕捉抗体序列中的上位效应并解耦选择与体细胞高频突变,从而在零样本变异效应预测及针对特定抗原的亲和力优化任务中超越了现有语言模型。
该研究通过 AI 驱动的自主大规模假设筛选,证实了生物基础模型(如 scGPT 和 Geneformer)在单细胞基因表达数据中确实学习到了具有生物学意义的非平凡几何与拓扑结构,且这种结构在不同独立训练的模型间表现出全局一致性,但在不同组织类型中的信号强度存在显著差异。
本文提出了混合在线与离线策略优化的记忆增强强化学习框架 EMPO,通过利用记忆机制有效解决了大语言模型智能体在探索新状态时的瓶颈,并在 ScienceWorld 和 WebShop 等基准测试中显著提升了性能及泛化能力。
该论文从信息论角度将多模态大模型的模态坍塌现象重新定义为“失配解码”问题,揭示了其性能瓶颈源于解码器的评分规则而非编码器架构,并证明了训练目标直接决定了模型可提取的信息范围。