SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications
本文介绍了 SwiftEmbed,这是一个基于 Rust 构建的面向实时应用的静态令牌查找文本嵌入系统,它利用 Potion-base-8M 蒸馏模型实现了 1.12 毫秒的超低延迟和每秒 5 万次请求的高吞吐,在去重和相似度任务中表现优异,同时显著降低了推理成本。
2506 篇论文
本文介绍了 SwiftEmbed,这是一个基于 Rust 构建的面向实时应用的静态令牌查找文本嵌入系统,它利用 Potion-base-8M 蒸馏模型实现了 1.12 毫秒的超低延迟和每秒 5 万次请求的高吞吐,在去重和相似度任务中表现优异,同时显著降低了推理成本。
本文提出了向量化在线 POMDP 规划器(VOPP),这是一种利用张量表示和完全向量化计算来消除并行依赖与同步瓶颈的新型在线求解器,其计算效率比现有最先进并行求解器高出至少 20 倍,且在仅需千分之一规划预算的情况下性能优于最先进序列求解器。
该论文提出了一种名为“扩散回弹”的取证方法,通过分析图像在扩散模型重建过程中的感知相似性变化来检测 AI 生成图像,在 4000 张图像数据集上实现了 0.993 的 AUROC 高精度,并展现出对压缩和噪声等常见失真的鲁棒性。
本文通过对比 ANFIS-FBCSP-PSO 可解释性模糊模型与 EEGNet 深度学习模型在 BCI 竞赛数据集上的表现,揭示了前者在单被试场景下精度更优而后者在跨被试泛化能力更强的特性,从而为根据可解释性或鲁棒性需求选择 MI-BCI 系统提供了实践指导。
本文提出了一种面向移动边缘计算的网络化混合专家(NMoE)系统,通过客户端基于专业能力的协同推理以及结合监督与自监督学习的联邦训练框架,有效解决了大模型在资源受限边缘设备上的训练与部署难题。
本文提出了名为 FATE 的新基准系列(包含 FATE-H 和 FATE-X),旨在填补大型语言模型在竞赛数学与研究级抽象代数形式化证明之间的能力鸿沟,评估结果显示当前最先进模型在该领域表现极差,且其将自然语言推理转化为形式化证明的能力远弱于推理本身。
本文介绍了名为"Jr. AI Scientist"的先进自主 AI 科研系统,该系统通过模拟初级研究者的完整工作流程,在基准论文基础上成功生成并验证了具有科学价值的新算法与论文,同时深入评估了其性能优势、当前局限性及潜在风险,为理解 AI 驱动科学探索的现状与未来挑战提供了重要见解。
该论文提出了一种名为 HatePrototypes 的可解释且可迁移的表示方法,仅需每类少量样本即可在无需重复微调的情况下,有效实现显性与隐性仇恨言论的跨任务检测与参数化早期退出。
该论文提出了名为 LAMP 的语言增强多智能体策略框架,通过“思考 - 表达 - 决策”流程将非结构化语言信息融入经济决策,显著提升了多智能体强化学习在模拟经济环境中的累积收益、鲁棒性及可解释性。
本文提出了 UnfoldLDM,一种将深度展开网络与潜在扩散模型相结合的新型盲图像恢复框架,通过多粒度退化感知模块估计未知退化,并利用抗退化扩散先验与过平滑校正 Transformer 协同解决现有方法对退化模型的依赖及纹理过平滑问题,从而在多种盲恢复任务中实现领先性能。
本文提出了一种结合高效视觉检测、轻量级多目标跟踪、GNSS 三角测量及置信度加权扩展卡尔曼滤波的多无人机系统,通过跨无人机 ID 对齐算法实现了海洋机器人在水面及近水面环境下的稳定、实时且高精度的全局跟踪。
本文针对 SmoothLLM 防御机制中过于严格的"k-不稳定”假设,提出了一种更贴合实际的"(k, )-不稳定”概率框架,通过结合攻击成功的经验模型推导出新的防御概率下界,从而为抵御各类越狱攻击提供了更可信且实用的安全认证保障。
本文提出了 Yo'City,一种利用大模型推理与组合能力的智能体框架,通过“城市 - 街区 - 网格”分层规划、基于自批评的图像合成循环以及关系引导的扩展机制,实现了个性化且无限可扩展的逼真 3D 城市场景生成。
该研究通过在 KM3NeT/ORCA 中引入受物理和探测器设计启发的注意力掩码,利用 Transformer 模型增强了低能中微子的重建与分类能力,并展示了其在不同配置间微调时保留探测器间有价值信息的有效性。
该论文提出了一种自动化流水线,用于生成基于“登门槛”心理原理的大规模多轮对话越狱数据集,并通过评估发现不同大模型家族在应对多轮上下文攻击时存在显著的安全差异,其中 GPT 系列模型对对话历史尤为脆弱,而 Gemini 2.5 Flash 则表现出极强的抵抗力。
本文提出了一种用于计算非退化三人及以上多人博弈中所有进化稳定策略的算法。
本文提出了一种名为 RadDiff 的新型检索增强去噪扩散模型,通过引入检索增强机制和知识感知模块来有效整合外部蛋白质知识,从而在蛋白质逆折叠任务中显著提升了序列恢复率和可折叠性,并克服了现有方法在知识利用和扩展性方面的局限。
该研究提出了名为 ForamDeepSlice 的高精度深度学习框架,通过构建严谨的 2D 微 CT 切片数据集并采用集成卷积神经网络模型,实现了 95.64% 的有孔虫物种分类准确率,同时开发了支持实时分类与三维匹配的交互式仪表盘,为微古生物学鉴定建立了新基准。
本文提出了一种基于因果基础模型的预测性维护框架,通过模拟干预措施来量化其对整体设备效率(OEE)的因果影响,从而帮助工程师识别根本原因并优化生产线的决策。
本文提出了 AltNet 方法,通过利用双网络交替角色机制,在周期性重置网络参数以恢复强化学习可塑性的同时,避免了性能下降,从而在安全关键的高维控制任务中实现了更高效的训练和更优的表现。