Proposing a Framework for Machine Learning Adoption on Legacy Systems
本文提出了一种基于 API 的实用框架,通过将机器学习生命周期与生产环境解耦,使企业无需升级遗留系统或停机即可安全、低成本地部署模型,从而赋能领域专家并提升制造竞争力。
3821 篇论文
本文提出了一种基于 API 的实用框架,通过将机器学习生命周期与生产环境解耦,使企业无需升级遗留系统或停机即可安全、低成本地部署模型,从而赋能领域专家并提升制造竞争力。
本文提出了 SMoPE 框架,通过将共享提示组织为稀疏混合专家(MoE)架构,利用动态专家选择、自适应噪声机制及基于原型的损失函数,在显著降低计算与存储成本的同时,有效解决了提示式持续学习中任务特定提示开销大与共享提示干扰严重的权衡问题,实现了性能与效率的双重提升。
RADAR 是一种受心理测量学启发的轻量级可解释路由框架,它通过学习查询难度与模型能力之间的响应模型,动态将高难度查询分配给高能力配置,从而在多个推理基准测试中实现了优于现有方法的性能与成本平衡。
本文提出了名为 Composer 的模块化混合神经网络架构搜索框架,通过在小规模上探索并借助扩展策略将最优架构放大,成功发现了在 350M 至 3B 参数规模下性能超越 Llama 3.2、显著提升下游任务准确率并优化训练与推理效率的新型混合大语言模型架构。
本文提出了 MIG-Vis 方法,通过结合变分自编码器与互信息引导的扩散模型,从灵长类颞下皮层神经群体中成功识别并可视化了具有清晰语义选择性(如物体姿态、类别间变换及类内内容)的结构化潜在子空间,从而直接揭示了高级视觉皮层中特征信息的组织原则。
该研究表明,在解决多智能体协作问题时,简单的通信协议比课程学习更为可靠,因为后者若设计不当(如强调背叛均衡)可能引发“习得性悲观”,从而削弱智能体的协作能力。
本文首次系统评估了自监督学习在可穿戴 EEG 睡眠分期中的应用,提出了一种专用流程,证明其仅需 5% 至 10% 的标注数据即可实现超过 80% 的临床级准确率,显著优于监督基线及通用 EEG 基础模型。
该研究基于 2018 至 2025 年 42 个经济体的数据,揭示了地缘政治冲击通过直接渠道重定价主权违约风险,而地缘经济冲击则通过货币政策预期和全球金融周期传导,两者形成“剪刀差”模式,并据此提出流动性供给可缓解金融周期传导的利差扩大,但无法消除地缘政治风险溢价中的持久成分。
本文提出了一种名为 HyWA 的新方法,利用超网络为语音活动检测(VAD)模型中的特定层生成个性化权重,从而在保持架构统一的同时,显著提升了个性化语音活动检测(PVAD)的平均精度并优化了部署效率。
该论文提出了一种名为“揭示 - 修订”的可解释性偏差感知生成框架,通过融合跨模态注意力、Grad-CAM++ 归因及迭代反馈机制,在多个基准测试中实现了超越现有基线的生成质量、鲁棒性及公平性。
该论文提出了一种新颖的绝对聚类指标,通过定义簇的紧致性函数和簇间邻域点集来量化簇的紧致性与可分性,从而有效确定数据中的真实簇数量,并在多种数据集上验证了其优于传统相对指标的性能。
该论文提出了一种基于数据协方差矩阵和目标函数多项式分解的“厄米特征结构假设”(HEA)理论框架,能够仅利用原始数据统计量准确预测真实数据集上的核回归学习曲线,并发现多层感知机在特征学习阶段也遵循该假设所预测的厄米多项式学习顺序。
该论文通过基于几何的统一分析,证明了在存在唯一且单链最优策略的假设下,价值迭代算法在折扣奖励和平均奖励两种设定下均具有比现有理论更优的几何收敛速度,从而解释了其实际表现优于传统理论预测的现象。
本文提出了 KVTC,一种基于主成分分析、自适应量化和熵编码的轻量级变换编码方法,能够在保持大语言模型推理精度和长上下文能力的同时,实现高达 20 倍(特定场景下 40 倍以上)的 KV 缓存压缩,从而显著降低显存占用并支持缓存复用。
该论文针对能源市场中连续发生的机制转换及现有方法缺乏因果解释的局限,提出了一种结合神经因果发现与多变量时序数据的增强型时间序列因果模型(ATSCM),旨在通过可解释的因子和动态因果图实现对电价形成机制的深入理解及反事实推理。
本文提出了一种结合变分自编码器与结构因果模型的时序神经因果模型(TNCM-VAE),通过引入有向无环图约束和因果 Wasserstein 距离,成功生成了既保留时间依赖性又符合因果机制的金融合成数据,从而显著提升了反事实概率估计的准确性并支持更可靠的金融压力测试与情景分析。
本文提出了一种结合图神经网络与 Transformer 的 DGET 多任务学习框架,以解决混合射频 - 光通信物联网网络中在部分信道观测和能量约束下 NP 难的双技术调度问题,实现了近最优的吞吐量与年龄信息(AoI)联合优化。
本文提出了 STREAM-VAE 模型,通过双路径编码器分离车辆遥测数据中的慢速漂移与快速尖峰动态,从而在多种工况下实现比现有基线方法更鲁棒的异常检测。
本文提出了一种针对医疗数据隐私风险的层次化双策略遗忘框架,通过几何约束梯度更新与概念感知令牌级干预相结合,在仅修改 0.1% 参数的情况下实现了 82.7% 的遗忘率与 88.5% 的知识保留,有效平衡了敏感信息移除与基础医疗能力保持的需求。
本文提出了 CostNav,这是首个结合行业标准监管与财务数据及物理仿真的经济导航基准,通过量化分析揭示现有导航方法在真实商业部署中均无法实现经济可行性,从而挑战社区开发以经济成本为核心指标的导航策略。