Taking Shortcuts for Categorical VQA Using Super Neurons
该论文提出了一种名为“超级神经元”(Super Neurons)的免训练方法,通过直接探测视觉语言模型浅层中生成的标量激活值来构建分类器,从而在显著提升分类性能的同时实现高达 5.10 倍的推理加速。
4615 篇论文
该论文提出了一种名为“超级神经元”(Super Neurons)的免训练方法,通过直接探测视觉语言模型浅层中生成的标量激活值来构建分类器,从而在显著提升分类性能的同时实现高达 5.10 倍的推理加速。
本文提出了一种结合上下文感知两阶段划分策略与残差空间误差校正的 AI 框架,通过解决空间自相关导致的泄漏问题,显著提升了 5G/6G 网络规划中细粒度蜂窝流量需求预测的准确性与泛化能力。
该论文提出了一种基于图注意力网络(HR-GAT)的层级多分辨率模型,利用公开部署数据在细粒度空间尺度上准确估算频谱需求,从而有效降低空间自相关并提升泛化能力,为频谱共享与分配决策提供了可靠支持。
该论文提出了名为 MCCOP 的框架,通过在预训练扩散模型引导的连续潜在空间中进行流形约束优化,生成兼具生物合理性、最小突变数且能实现目标属性(如稳定性或活性)的蛋白质序列反事实,从而为蛋白质工程提供可解释的机制洞察和具体的设计指导。
该论文提出并评估了一种基于随机平滑的防御机制,证明其能在不牺牲正常场景下预测精度的前提下,有效且低成本地提升多种轨迹预测模型在自动驾驶场景中对对抗攻击的鲁棒性。
ReTabSyn 是一种基于强化学习的表格数据合成框架,它通过优化条件分布 而非全联合分布,在小样本、类别不平衡及分布偏移等场景下显著提升了合成数据的下游任务效用。
针对数据稀缺的 NPU 内核合成领域,本文提出了名为 EvoKernel 的自进化智能体框架,通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程,显著提升了大模型在特定硬件生态中的代码正确率与执行效率。
本文提出了模型,通过实时统计检验动态融合通用价值模型先验与稀疏采样经验均值,在极低方差下构建鲁棒优势基线,从而在数学推理任务中显著超越 GRPO 和 DAPO 并实现更快的收敛。
本文介绍了一个名为 6ABOS 的开源 Python 框架,该框架基于 6S 辐射传输模型并结合 Google Earth Engine 动态大气参数检索,实现了 EnMAP 高光谱影像的自动化大气校正,并在不同营养状态的地表水体中验证了其高精度反演水体离水反射率的能力。
该论文提出了 SNPgen,一种基于潜在扩散模型的两阶段条件生成框架,能够生成与表型对齐的合成基因型数据,在保护隐私的同时实现了与真实数据相当的疾病预测性能,并有效保留了遗传结构特征。
本文提出了名为 LAtte 的新框架,通过结合洛伦兹注意力模块与 InceptionTime 编码器,利用预训练共享基线信号和洛伦兹低秩适配器学习特定主体嵌入,有效解决了脑电图(EEG)分类中信号信噪比低及主体间差异大的挑战,显著提升了跨主体分类的性能与泛化能力。
该论文提出了一种参数高效的连续扩散 Transformer 模型,通过引入 2D CNN 输入编码器替代传统 U-Net 骨干网络,在显著降低训练成本、收敛损失及序列记忆化风险的同时,结合 DDPO 微调与 Enformer 奖励模型,成功生成了具有高预测活性的细胞类型特异性合成调控 DNA 序列。
本文提出了一种基于核函数(包括核 Stein 差异和最大均值差异)的新颖等价性检验方法,旨在克服传统拟合优度检验无法有效证明分布间无显著差异的局限,通过设定预定义差异边界并采用渐近正态近似或自举法计算临界值,从而在控制误差率的前提下评估候选分布与名义分布的等价性。
本文提出了一种名为“动力学预测采样”(DPS)的新方法,通过将提示词在强化学习微调中的解决进度建模为动态系统并利用贝叶斯推断进行在线预测,从而在无需昂贵的大量推理滚动的情况下高效筛选出高价值训练样本,显著降低了计算开销并提升了大型推理模型的微调效率与性能。
本文通过示例探讨了非遍历奖励过程对强化学习智能体的影响,阐明了遍历性奖励过程与遍历马尔可夫链的联系,并介绍了在遍历性奖励动态下优化个体轨迹长期性能的现有解决方案。
LookaheadKV 提出了一种轻量级的 KV 缓存淘汰框架,通过引入参数高效模块直接预测未来重要性评分,在无需耗时的草稿生成前提下,实现了比现有方法更精准的淘汰效果并显著降低了推理开销。
该论文提出了一种基于组合融合分析(CFA)的新方法,通过秩 - 分特征函数和认知多样性整合多种评分系统来生成球队排名,在 2024 年 NCAA 锦标赛预测中取得了 74.60% 的准确率,优于现有的十大主流排名系统。
本文提出了面向部署的 ECoLAD 评估协议,通过在受限计算资源下对多种异常检测器进行实证研究,揭示了仅关注准确率的现有基准测试可能误导部署决策,并证明轻量级经典检测器在车载遥测场景的吞吐量约束下比深度学习方法更具可行性。
该论文提出了一种名为“历史共识训练”的迭代方法,通过利用高斯混合模型聚类的多样性来构建参数空间中的稳定屏障,从而在无需特定架构约束或超参数调优的情况下,彻底消除了变分自编码器中的后验坍塌问题。
该论文提出了一种基于核密度估计(KDE)的实用方法,通过建模合成数据与训练记录间的最近邻距离分布,在不依赖计算密集型影子模型的情况下,有效量化了表格合成数据中的成员披露风险,并实现了比现有基线更优的风险评估效果。