Just-In-Time Objectives: A General Approach for Specialized AI Interactions
该论文提出了一种“即时目标”(Just-In-Time Objectives)方法,通过被动观察用户行为实时推断并优化其特定目标,从而引导大语言模型动态生成高度个性化的专用工具与高质量交互响应,显著优于传统通用模型。
5065 篇论文
该论文提出了一种“即时目标”(Just-In-Time Objectives)方法,通过被动观察用户行为实时推断并优化其特定目标,从而引导大语言模型动态生成高度个性化的专用工具与高质量交互响应,显著优于传统通用模型。
本文提出了 3DThinker 框架,通过两阶段训练使视觉语言模型在无 3D 先验和标注数据的情况下,能够像人类一样利用图像中的几何信息进行 3D 空间想象与推理,从而在有限视角下显著提升了空间关系理解能力。
该研究通过引入三项子群一致性检验,证实了 ChatGPT 在基于性别和种族/民族群体的协作沟通数据编码中,其表现与人类评分者保持一致,从而验证了其在大规模协作评估中的应用潜力。
该论文提出了一种受贝叶斯实验设计启发的蒙特卡洛推理策略,通过“协作战舰”等任务显著提升了语言模型在信息寻求任务中的提问质量与决策理性,使其在成本极低的情况下甚至能超越人类和前沿模型的表现。
本文提出了 REx86,一个基于 Qwen2.5-Coder-7B 模型并通过 5981 个 x86 汇编样本进行参数高效微调的本地开源大语言模型,旨在解决逆向工程中的隐私与效率问题,实验表明其在代码理解准确性和注释质量上显著优于基线模型。
本文提出了 LA-MARRVEL 框架,这是一种基于知识且具备语言感知能力的临床级大语言模型系统,它通过构建富含表型的结构化提示,在罕见病致病基因优先排序任务中显著提升了召回率,并能生成符合 ACMG 标准的可审计临床推理。
该论文针对生成式扩散模型中文化记忆与泛化能力交织的“多模态图标性”现象,提出了将“识别”与“实现”分离的评估框架(CRT 指标),通过大规模实验揭示了模型在文化引用下的行为差异及其受数据频率、文本独特性等多重因素的影响,从而推动了从简单图文匹配向深层语境理解的评估范式转变。
该论文提出了软 Q 函数重参数化策略梯度扩散微调(SQDF)方法,通过引入折扣因子、一致性模型集成及离线回放缓冲区等创新,有效解决了扩散模型微调中的奖励过优化问题,在提升目标奖励的同时保持了样本的多样性与自然性。
本文提出了 XR-DT 框架,该框架结合扩展现实(XR)数字孪生技术与基于注意力机制的轨迹预测模型,通过新型的人类感知模型预测路径积分(HA-MPPI)控制器,实现了人机共享空间中安全、高效且可解释的机器人运动规划。
该论文指出强化学习导致大语言模型推理多样性下降的根源在于其隐式优化了“零强制”反向 KL 散度,并提出了一种基于-散度族的新方法,通过显式构建目标分布并调节精度与多样性的权衡,在 Lean 定理证明基准上实现了覆盖率和精度的最优平衡。
该论文提出了一种基于点云框架的事件驱动人体姿态估计方法,通过设计事件时间切片卷积与序列模块以及边缘增强表示,有效利用事件流的时空特性,在保持计算效率的同时显著提升了在稀疏事件条件下的姿态估计精度。
该论文提出了 A-3PO 方法,通过用简单插值替代显式计算来近似异步强化学习训练中的近端策略,从而在保持性能的同时消除了额外前向传播开销,使大语言模型训练速度提升了 1.8 倍。
本文提出了一种基于个体条件期望(ICE)曲线的全局敏感性分析方法,通过计算 ICE 曲线的期望特征重要性及其标准差来有效捕捉输入变量间的交互作用,克服了传统偏依赖图(PDP)在强交互场景下因平均化效应而掩盖交互信息的局限,并通过数学证明和多个工程算例验证了该方法在揭示数据驱动模型特征重要性方面的优越性。
该论文通过深入分析双曲几何中梯度优化失败的根本原因,提出了包含特征正则化、分类价值损失及优化友好型网络层的新算法 Hyper++,从而在 ProcGen 和 Atari-5 等基准测试中实现了比现有双曲及欧几里得方法更稳定、高效且性能更优的强化学习训练。
该论文首次系统研究了由大语言模型驱动的单智能体多工具架构中存在的“工具编排隐私风险”(TOP-R),通过构建基准测试揭示其普遍性并分析成因,进而提出了针对输出、推理和审查阶段的有效缓解策略。
该论文通过深入分析并改进交叉注意力机制,证明了其在视觉语言模型中不仅能实现与直接插入图像令牌相当的性能,还能显著降低长序列多图像对话及实时视频处理中的显存与计算开销。
本文提出了 CARE(对比锚定反思)框架,通过结合锚定对比目标与反思引导重采样技术,将多模态推理中的失败案例转化为有效监督信号,从而在无需测试时反思的情况下显著提升模型准确率与训练稳定性。
该论文提出了首个针对动态图时序模式分析的LLM基准LLMTM,并设计了一种结合工具增强智能体与结构感知调度器的框架,在显著降低计算成本的同时实现了高精度的时序模式分析。
该论文提出了一种名为 WBC 的基于滑动窗口的成员推断攻击方法,通过聚合不同尺度局部上下文中的损失比较信号,显著提升了在微调大语言模型中识别训练数据的能力,并揭示了局部证据聚合比全局平均更有效的隐私漏洞。
该论文提出了一种通过集成七种可读性指标和聚类方法微调大语言模型的框架,成功生成了涵盖六个教育阶段的适龄教学内容,在保持事实准确性的同时将年级对齐度相比提示方法提升了 35.64 个百分点,从而有效应对全球师资短缺并促进教育公平。