CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data
本文提出了 CauKer 算法,通过结合高斯过程核组合与结构因果模型生成具有因果一致性的合成时间序列数据,实现了时间序列基础模型的高效预训练,并揭示了其在数据规模与模型容量上呈现的清晰缩放规律。
2443 篇论文
本文提出了 CauKer 算法,通过结合高斯过程核组合与结构因果模型生成具有因果一致性的合成时间序列数据,实现了时间序列基础模型的高效预训练,并揭示了其在数据规模与模型容量上呈现的清晰缩放规律。
本文提出了 GraphProp 方法,通过分两阶段训练(先利用图不变量预测构建结构基础模型,再将其作为位置编码融合节点属性),有效解决了图基础模型在跨域结构泛化上的不足,显著提升了其在图分类等任务中的表现,特别是在处理无节点属性图时的优势。
本文提出了 Video-EM,一种无需训练的事件中心式情节记忆框架,通过利用大语言模型作为主动代理来构建、精炼并验证连贯的事件时间线,从而有效解决现有视频大模型在处理长视频时因上下文限制和孤立帧选择导致的叙事断裂与冗余问题。
本文提出了 UniCast,一种通过实例条件提示和动态模态路由机制,在冻结的时间序列基础模型上实现参数高效的多模态融合与实例自适应预测的统一框架。
本文提出了名为 ECHO 的新型基础模型,通过融合频带分割架构与频率位置编码,实现了对任意采样率和可变长度机器信号(如声学、振动及工业传感器数据)的高效建模,并在异常检测与故障分类任务中取得了领先性能。
该论文提出了一种融合熵驱动课程学习与多任务学习的统一框架,通过基于 Lempel-Ziv 压缩的轨迹可预测性量化实现由简入繁的训练,并联合优化位置、距离及方向预测,从而在 HuMob 挑战赛中实现了状态最先进的人体移动预测性能与显著加速的收敛速度。
本文提出了一种结合基于学习的控制器与安全控制器的混合方法,通过利用归一化流模型构建环境先验来实时监测分布外状态,从而在确保地下洞穴环境中飞行安全的同时,实现了快速自主导航。
本文提出了 OTESGN 模型,通过结合句法图感知注意力与基于最优传输的语义注意力机制,有效解决了传统方法在捕捉非线性关联和抗噪方面的不足,从而在多个基准数据集上实现了方面级情感分析的最优性能。
该研究提出了一种基于外部视觉观察和计算机视觉技术(如 YOLO 目标检测与车道监测)的新型驾驶员行为分类系统,旨在无需车载通信即可实时识别分心或受 impaired 驾驶等不安全行为,从而提升自动驾驶环境下的道路安全。
本文提出了一种基于生成式人工智能的模块化多模态框架,利用公开图像和住宅信息合成逼真的建筑参数数据,从而解决建筑能耗研究中数据获取成本高、隐私受限等问题,并支持从单体建筑到区域尺度的能源模拟研究。
本文提出了 MICA(多智能体工业协调助手),这是一个在受限计算与隐私约束下运行的感知驱动、语音交互系统,它通过五个角色专用智能体与自适应步骤融合技术,为工业装配、故障排查等任务提供实时、安全且可靠的指导,并建立了相应的评估基准以验证其优越性。
本文提出了一种基于场景图的原子技能学习框架,通过聚焦任务相关对象与关系来缓解分布偏移,并结合扩散模型与视觉语言规划器,显著提升了通用机器人在长程复杂任务中的执行鲁棒性与组合泛化能力。
本文提出了名为 FINS 的轻量级框架,通过结合多分辨率哈希网格编码器与预训练基础模型,实现了仅需单张 RGB 图像即可在数秒内高效重建高保真隐式表面及 SDF 场,并在收敛速度、重建精度及机器人表面跟随任务中优于现有最先进方法。
该研究发现,线性探针严重依赖文本证据(如系统提示或思维链),一旦过滤掉这些表面文本信息,其在检测沙袋行为、阿谀奉承和偏见等潜在有害行为时的性能会显著下降,表明此类探针在识别非表层模式时存在脆弱性。
本文基于贝叶斯说服理论构建了一个可扩展的评估与训练框架,利用强化学习使大语言模型(包括小模型)能够掌握复杂的战略说服策略并显著提升说服效果。
本文提出了生成式进化元求解器(GEMS),这是一种无需代理的框架,它利用潜在锚点和单一生成器替代显式策略种群,在保留博弈论保证的同时显著降低了计算与内存开销,从而实现了可扩展的多智能体强化学习。
该论文提出了基于野外语料库中显著词元困惑度的“基准签名”方法,通过跨 32 个大模型和 89 个基准的元评估,揭示了不同基准间在知识与推理任务上的深层重叠、在文化与人文领域的低相似性,以及编码任务的高度独立性,从而为理解大模型能力景观及基准有效性提供了超越传统性能相关性的新视角。
本文提出了 ELHPlan 框架,通过引入“意图绑定动作链”作为规划原语,在长视野多智能体协作任务中有效平衡了适应性与计算效率,在保持任务成功率的同时将 Token 消耗降低了 60-70%。
该论文针对缺乏初始成对相似性信息的冷启动场景,提出了一种通过鼓励多样性来实现成本高效查询的覆盖感知主动关联聚类方法,并通过实验验证了其有效性。
该论文首次系统性地提出并实证了“误演化”(Misevolution)概念,揭示了自进化大语言模型代理在模型、记忆、工具和工作流四个关键路径中可能偏离预期并引发安全对齐退化或漏洞等新型风险,从而强调了构建更安全自进化代理的紧迫性。