Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning
本文提出了 LTSV 方法,通过结合上下文微调与时间块聚合技术,在时间序列基础模型上实现了兼具高效性、准确性及时间依赖捕捉能力的数据估值。
4856 篇论文
本文提出了 LTSV 方法,通过结合上下文微调与时间块聚合技术,在时间序列基础模型上实现了兼具高效性、准确性及时间依赖捕捉能力的数据估值。
本文提出了一种基于时间序列基础模型(TSFM)的上下文学习方法,通过无需微调或训练传统分类模型即可利用振动数据中的频域参考信号来评估伺服冲压机轴承的健康状态,从而展示了其在不同工况下的有效性并推动了向模型即服务(MaaS)或软件即服务(SaaS)模式的智能运维系统发展。
该论文提出了一种名为“周期性异步”的框架,通过将推理与训练解耦为异步流水线并引入统一三模型架构,在保持严格在线策略正确性的同时,显著提升了大语言模型强化学习的端到端训练吞吐量。
本文提出了一种名为 Decoder-DeepONet (DDON) 的新型可解释算子学习模型,通过实现函数到函数的映射,在电光效应(EFISH)信号反演中显著提升了非平衡等离子体放电电场轮廓的重建精度、泛化能力及对不完整数据的适应性,并利用积分梯度法优化了数据采集窗口。
该论文提出了一种名为 ELERAG 的检索增强生成架构,通过整合基于 Wikidata 的实体链接和混合重排序策略,显著提升了意大利语教育领域问答系统的事实准确性,并验证了领域自适应策略在解决通用模型与专业领域数据分布不匹配问题上的有效性。
本文提出了 SA²GFM 框架,通过结构感知语义增强、基于信息瓶颈的自监督蒸馏、混合专家路由机制以及分层结构微调,显著提升了图基础模型在噪声、结构扰动及对抗攻击下的鲁棒性与跨域泛化能力。
该论文提出了 ADHint 方法,通过引入样本难度先验来动态调整提示比例,并结合一致性梯度调制与基于难度的优势估计,有效解决了现有基于提示的强化学习方法中探索与模仿失衡及训练不稳定的问题,从而显著提升了模型的推理能力与泛化性能。
该论文提出了方向性文本反转(DTI)方法,通过将嵌入向量幅度固定并仅在单位超球面上优化方向,有效解决了传统文本反转中因嵌入范数膨胀导致的提示词失准问题,从而在提升文本忠实度的同时实现了概念间的平滑语义插值。
该研究评估了基于多通道线性描述符的块场方法(MLD-BFM)在 HD sEMG 多自由度手指运动解码中的表现,发现其虽在数值上优于传统特征和降维方法,但统计上未显著超越时域特征,表明高密度记录本身已通过幅度描述符编码了空间信息,而保留空间分辨率对准确回归至关重要。
本文提出了 EMFusion,这是一种基于条件扩散框架的频选电磁场概率预测模型,它通过集成多源上下文信息、采用残差 U-Net 与交叉注意力机制以及基于插补的采样策略,实现了对无线网络中多运营商、多频段电磁场水平的精准预测与可信的不确定性量化。
本研究提出了一种通过机器学习辅助参数优化(包括可学习参数、参数边界和选择性损失)来增强小波变换非晶径向分布函数(WT-RDF)振幅精度的 WT-RDF+ 框架,该框架在 Ge-Se 及 Ag-Ge-Se 体系的结构重构中,即使仅使用 25% 的二元数据集,其表现也优于基于 AIMD 模拟数据的 RBF 和 LSTM 等基准机器学习模型。
该论文通过揭示激活值在梯度下降中存在的非理想缩放问题,从第一性原理重新推导了归一化机制,并提出了一种无需尺度不变性的新型函数(如 PatchNorm),在多项测试中超越了传统归一化方法。
本文利用性能估计问题(PEP)证明了在分布式优化中引入局部更新(特别是仅需两次)可在保持步长的同时加速收敛,从而首次严格确立了局部更新对一类广泛目标函数的加速效果。
该论文提出了一种名为贝叶斯生成建模(BGM)的统一框架,通过随机迭代贝叶斯更新算法学习生成模型,从而无需重新训练即可实现对任意变量子集的灵活条件推断,并兼具优越的预测性能、不确定性量化能力及理论保证。
该论文提出了一种利用大语言模型驱动的网络研究代理自动生成并解决大规模多样化现实世界预测问题的系统,该系统在生成可验证问题和准确解决方面的表现优于人类策划平台,并成功验证了更智能的模型及问题分解策略能显著提升预测精度。
该论文提出了名为"Infusion"的框架,利用可扩展的影响函数近似技术,通过对训练数据施加微小扰动来诱导模型产生目标行为,实验表明该方法在视觉和语言领域均能有效且隐蔽地塑造模型行为,并具备跨架构的迁移能力。
本文提出了一种基于观测数据的鲁棒 assortment 优化框架,通过建模客户偏好分布偏移并最大化最坏情况下的预期收益,在理论界定了计算可行性与样本复杂度上下界的同时,揭示了实现样本高效鲁棒学习所需的最小数据条件“鲁棒单项覆盖”,从而弥合了鲁棒性与统计效率之间的差距。
该论文提出了一种基于瓶颈 Transformer 架构的新方法,通过结合卷积块与多头自注意力机制来预测短时客观可懂度(STOI)指标,在无需参考语音的非侵入式评估中,其表现优于现有的自监督学习模型。
受非平衡热力学启发的扩散模型虽性能卓越但推理延迟高,而现有蒸馏技术因丢弃中间步骤导致结构信息丢失和离散化误差,为此本文提出了 B-DENSE 框架,通过多分支轨迹对齐机制,让学生模型在扩展通道中同时映射教师轨迹的所有离散中间步骤,从而在训练早期实现密集监督并显著提升生成质量。
本文提出了“缺失即设计”(MBD)框架,通过结合结构化表征学习与可验证的参数修改流程,实现了多模态情感分析中特定模态信息的可撤销删除,在保障用户隐私自主权的同时维持了模型的高效预测性能。