Stable Multi-Drone GNSS Tracking System for Marine Robots
本文提出了一种结合高效视觉检测、轻量级多目标跟踪、GNSS 三角测量及置信度加权扩展卡尔曼滤波的多无人机系统,通过跨无人机 ID 对齐算法实现了海洋机器人在水面及近水面环境下的稳定、实时且高精度的全局跟踪。
3834 篇论文
本文提出了一种结合高效视觉检测、轻量级多目标跟踪、GNSS 三角测量及置信度加权扩展卡尔曼滤波的多无人机系统,通过跨无人机 ID 对齐算法实现了海洋机器人在水面及近水面环境下的稳定、实时且高精度的全局跟踪。
本文针对 SmoothLLM 防御机制中过于严格的"k-不稳定”假设,提出了一种更贴合实际的"(k, )-不稳定”概率框架,通过结合攻击成功的经验模型推导出新的防御概率下界,从而为抵御各类越狱攻击提供了更可信且实用的安全认证保障。
本文提出了 Yo'City,一种利用大模型推理与组合能力的智能体框架,通过“城市 - 街区 - 网格”分层规划、基于自批评的图像合成循环以及关系引导的扩展机制,实现了个性化且无限可扩展的逼真 3D 城市场景生成。
该研究通过在 KM3NeT/ORCA 中引入受物理和探测器设计启发的注意力掩码,利用 Transformer 模型增强了低能中微子的重建与分类能力,并展示了其在不同配置间微调时保留探测器间有价值信息的有效性。
该论文提出了一种自动化流水线,用于生成基于“登门槛”心理原理的大规模多轮对话越狱数据集,并通过评估发现不同大模型家族在应对多轮上下文攻击时存在显著的安全差异,其中 GPT 系列模型对对话历史尤为脆弱,而 Gemini 2.5 Flash 则表现出极强的抵抗力。
本文提出了一种用于计算非退化三人及以上多人博弈中所有进化稳定策略的算法。
本文提出了一种名为 RadDiff 的新型检索增强去噪扩散模型,通过引入检索增强机制和知识感知模块来有效整合外部蛋白质知识,从而在蛋白质逆折叠任务中显著提升了序列恢复率和可折叠性,并克服了现有方法在知识利用和扩展性方面的局限。
该研究提出了名为 ForamDeepSlice 的高精度深度学习框架,通过构建严谨的 2D 微 CT 切片数据集并采用集成卷积神经网络模型,实现了 95.64% 的有孔虫物种分类准确率,同时开发了支持实时分类与三维匹配的交互式仪表盘,为微古生物学鉴定建立了新基准。
本文提出了一种基于因果基础模型的预测性维护框架,通过模拟干预措施来量化其对整体设备效率(OEE)的因果影响,从而帮助工程师识别根本原因并优化生产线的决策。
本文提出了 AltNet 方法,通过利用双网络交替角色机制,在周期性重置网络参数以恢复强化学习可塑性的同时,避免了性能下降,从而在安全关键的高维控制任务中实现了更高效的训练和更优的表现。
该论文提出了一种名为“双重随机平滑”的新框架,通过引入输入依赖的噪声方差估计器并证明其有效性,成功突破了传统全局噪声方差在兼顾小半径和大半径鲁棒性认证时的性能瓶颈,显著提升了模型在不同扰动半径下的准确率。
该论文提出了名为 Graphectory 的图结构表示法以系统分析智能体软件系统的执行轨迹,通过大规模实证研究揭示了不同模型与提示词下的策略差异,并进一步开发了实时监测与干预机制,显著提升了智能体解决软件工程问题的成功率并缩短了执行路径。
本文提出了稀疏各向同性 Shapley 回归(SISR)框架,通过联合学习单调变换以恢复可加性并施加 L0 稀疏约束,有效解决了传统 Shapley 值在处理非线性依赖和特征选择时的失真与计算效率问题,为高维非线性可解释性提供了理论坚实且实用的解决方案。
该论文提出了平行解码器 Transformer(PDT),这是一种在冻结主干架构中引入规划器引导的潜在工作空间与同步多流输出协议的模型,通过将并行任务分解从外部提示策略转变为模型内部的协调机制,实现了多流生成间的状态同步、所有权解析及信息等待。
本文针对非结构化野外环境下的矢量路网提取难题,发布了大规模数据集 WildRoad 并提出了基于路径推理的 MaGRoad 框架,通过聚合多尺度视觉证据有效克服了现有节点中心方法的局限性,在显著提升野外场景拓扑精度的同时实现了更快的推理速度。
本文提出了 SALVE 框架,通过结合稀疏自编码器与 Grad-FAM 验证方法,实现对神经网络特征的无监督发现、可视化验证及基于权重空间的精确编辑,从而在卷积和 Transformer 模型上达成可解释的机制性控制。
这篇论文提出了一种涵盖智能体与工具适应的四范式框架,系统综述了大语言模型智能体在预训练后通过微调、偏好优化、强化学习以及记忆和技能系统实现持续进化的最新进展、权衡与评估实践。
本文提出了名为 LaMer 的元强化学习框架,通过跨回合训练和基于反思的上下文策略适应机制,有效解决了语言智能体在长程任务中探索不足与试错适应低效的问题,显著提升了其在多样化环境中的性能与泛化能力。
本文提出了 Re-Depth Anything 框架,通过利用大规模 2D 扩散模型先验进行自监督重光照与重合成,在测试阶段无需标签即可显著修正基础深度模型(如 Depth Anything V2/3)在真实场景中的预测误差,从而实现了当前最先进的单目深度估计精度与真实感。
该论文通过基于 Google BigQuery 的大规模实证研究,揭示了推理与非推理大语言模型在 Text-to-SQL 任务中的成本权衡,指出执行时间与云计费成本弱相关,且非推理模型因缺乏分区过滤等优化会导致高达 3.4 倍的成本波动,从而为企业部署提供了降低财务风险的关键指导。