Telogenesis: Goal Is All U Need
该论文提出了一种名为“目标生成(Telogenesis)”的机制,证明仅通过利用无知、意外和过时性这三种认知差距来内生地生成注意力优先级,无需外部奖励即可使智能体在部分可观测环境中自适应地分配注意力,不仅优于固定策略,还能无监督地恢复环境波动结构。
2393 篇论文
该论文提出了一种名为“目标生成(Telogenesis)”的机制,证明仅通过利用无知、意外和过时性这三种认知差距来内生地生成注意力优先级,无需外部奖励即可使智能体在部分可观测环境中自适应地分配注意力,不仅优于固定策略,还能无监督地恢复环境波动结构。
GenePlan 是一个利用大语言模型辅助进化算法的框架,通过迭代优化可解释的 Python 规划器,在多个基准领域中以低成本实现了接近最先进水平且显著优于传统提示方法的 PDDL 泛化规划性能。
该论文提出“第三实体”概念,认为人类与生成式人工智能的交互并非简单的工具协作,而是通过“氛围创造”(vibe-creation)这一前反思认知模式,在两种不可通约的认知方式耦合中涌现出一种兼具新颖性与人类责任归属的不对称认知形态,从而深刻重塑了认识论、心灵哲学及教育理论。
本文提出了一种名为“时间条件归一化流(tcNF)”的新框架,通过利用自回归机制对时间序列中的复杂依赖关系和不确定性进行精确建模,从而实现高效且鲁棒的异常检测。
本文提出了名为 EvoPrompt 的新框架,通过模态共享提示投影器、解耦进化训练策略以及特征几何正则化,在实现少样本任务高性能适配的同时,有效解决了视觉语言模型微调过程中的灾难性遗忘问题,从而在保留预训练零样本能力的同时完成稳定进化。
该论文提出了名为 EDA 的参数与数据高效框架,通过解耦架构、数据再生策略及样本选择机制,在显著降低训练成本的同时,有效解决了目标模型微调后推测解码性能下降的问题。
该研究提出了一种利用大语言模型(LLM)结合大五人格特质生成个性化辟谣信息的新方法,并通过模拟相应人格的 LLM 评估器验证了此类定制化信息通常比通用信息更具说服力,同时指出了该技术带来的伦理挑战。
该论文提出了一种基于 XLA 编译器的 Mamba-2 状态空间模型实现方案,通过仅使用标准算子而非定制 CUDA 内核,在 CPU、NVIDIA GPU 和 Google TPU 上实现了可移植的 自回归缓存推理,并达到了与 PyTorch/CUDA 参考实现一致的精度和显著的性能。
该论文提出了“无遗忘路由”(RwF)架构,通过在 Transformer 中引入基于能量的关联检索层(受现代 Hopfield 网络启发),实现了无需任务标识或迭代优化的动态提示生成,从而在严格在线持续学习场景下显著优于现有的提示微调方法。
该论文提出了一种基于能量守恒和极值作用原理的变分潜在平衡框架,通过推导实时误差动力学,将时间连续的反向传播算法转化为生物可实现的局部时空学习规则,从而为大脑的时空深度学习及物理电路实现提供了严谨的理论基础。
该论文提出从提示工程演进为包含上下文工程、意图工程和规格工程的四层成熟度模型,旨在通过系统化设计信息环境、组织目标及机器可读规范,解决企业多智能体系统在规模化部署中面临的复杂性与控制难题。
该论文提出了一种结合视觉与语言模型的基于地面真值的合成数据生成与评估框架,并发布了包含 40 万张图像的大规模遥感数据集 ARAS400k,实验证明将合成数据与真实数据结合使用能显著提升语义分割和图像描述任务的性能。
PRECEPT 是一个统一的测试时适应框架,通过结合确定性精确规则检索、冲突感知记忆机制以及由 COMPASS 驱动的帕累托引导提示演化,有效解决了大语言模型在条件增多时的检索退化、规则组合困难及知识陈旧问题,并在多项基准测试中展现出显著的鲁棒性与性能提升。
该论文提出了 MM-tau-p基准,旨在通过引入 12 项新指标,在双控制设置下评估多模态智能体在融入用户人格画像时的鲁棒性、多模态能力及时延开销,从而填补现有文本驱动评估框架在个性化多模态交互场景中的空白。
本文提出了首个专注于评估大语言模型生成原则驱动型交互式应用(MiniApps)能力的基准测试 MiniAppBench,并配套开发了基于智能体自动化探索的评估框架 MiniAppEval,以解决现有基准无法有效衡量动态交互逻辑及缺乏单一标准答案的难题。
本文提出了一种名为 KV-Lock 的训练免费框架,通过利用扩散幻觉检测动态调节背景键值缓存融合比例与引导强度,在视频编辑任务中有效平衡了前景生成质量与背景一致性。
该论文提出了一个用于图神经网络时间序列异常检测的开源框架,通过系统性评估揭示了 GNN 在提升检测性能与可解释性方面的优势,并批判性地反思了当前领域在指标设计与阈值策略上的局限性。
该论文提出了 Omni Parsing 框架,通过整合全息检测、细粒度识别与多级解读三个层级,并引入证据锚定机制,将非结构化多模态数据转化为可追溯的标准化结构化知识,同时发布了 Logics-Parsing-Omni 模型及 OmniParsingBench 基准以验证其有效性。
该论文提出了 EsoLang-Bench 基准,通过利用缺乏预训练数据且难以被“刷分”的极简主义编程语言,揭示了大型语言模型在标准代码生成任务中表现优异实则依赖记忆,而在需要真正推理能力的任务中表现极差,从而证明现有模型缺乏真正的泛化推理能力。
该研究提出了一种基于大型上下文电子健康记录的自动心血管风险管理分类框架,通过对比传统机器学习、专用深度学习架构及生成式大语言模型,证实了定制 Transformer 模型在捕捉医疗文本长程依赖方面表现最优,为老年心血管风险分层提供了高效的自动化替代方案。