Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts
该论文提出了一种无需训练的参数化提示框架,通过将提示视为基于智能体状态动态构建的“动作”,成功实现了对大语言模型多智能体对话行为(如反驳、证据使用及立场转变)的有效引导,为社交模拟方向的多智能体系统研究提供了新思路。
11345 篇论文
该论文提出了一种无需训练的参数化提示框架,通过将提示视为基于智能体状态动态构建的“动作”,成功实现了对大语言模型多智能体对话行为(如反驳、证据使用及立场转变)的有效引导,为社交模拟方向的多智能体系统研究提供了新思路。
该论文提出了一种名为 MSSR 的记忆感知自适应回放框架,通过估计样本级记忆强度并动态调整复习间隔,在持续微调大语言模型时有效缓解了灾难性遗忘问题,同时保持了快速适应能力,并在多项基准测试中显著优于现有方法。
本文提出了 MedMASLab,这是一个统一的医疗多智能体系统编排框架与基准测试平台,通过引入标准化通信协议、基于大模型的零-shot 临床推理评估器以及涵盖 11 个器官系统和 473 种疾病的广泛基准,旨在解决当前医疗多智能体研究中的架构碎片化与多模态集成缺失问题,并揭示了现有架构在跨专科迁移时的性能脆弱性。
该论文提出了一种利用人工智能和机器学习技术,结合站点许可与众包数据代理来准确预测频谱需求的数据驱动方法,并在加拿大五个主要城市验证了其高达 0.89 的拟合优度,从而为频谱监管者优化资源分配和政策制定提供了有效支持。
该论文提出了 ACADiff 框架,利用自适应临床感知潜在扩散模型,通过融合成像数据与 GPT-4o 编码的临床元数据,实现了阿尔茨海默病多模态脑图像(sMRI、FDG-PET、AV45-PET)的高质量双向合成与缺失模态补全,在极端缺失场景下仍保持了优越的诊断性能。
该论文提出了一种结合地理空间分析与机器学习的驱动方法,通过加拿大城市案例研究成功预测了频谱需求的空间变化及其关键驱动因素,为 6G 网络灵活频谱接入政策的制定提供了数据支撑。
本文提出了 PathMem,一种受病理学家分层记忆过程启发的记忆中心多模态框架,通过将结构化病理知识组织为长期记忆并利用记忆 Transformer 实现动态激活与上下文感知 grounding,显著提升了病理多模态大模型在诊断推理和报告生成方面的性能。
该论文提出了名为 k-MTR 的 k 空间多任务表示学习框架,通过在大规模模拟数据上构建 k 空间与全采样图像的共享语义流形,实现了从欠采样 k 空间数据直接进行心脏 MRI 的连续表型回归、疾病分类和解剖分割,从而突破了传统“先重建后分析”范式的局限。
本文通过区分结构性不确定性与情境性不确定性,阐明了基于置信度的排序决策系统何时能单调提升决策质量,并指出在分布偏移下传统置信信号失效而情境感知方法仅能部分缓解,从而为置信度门控的实际部署提供了诊断框架。
该论文提出利用过拟合 - 欠拟合指示器(OUI)作为早期信号,通过分析 PPO 中隐藏神经元的激活模式变化来区分学习率设置,从而在训练初期高效筛选出最优策略并避免全量训练。
该论文提出了“神经调试器”这一新概念,通过微调大语言模型或从头预训练小模型,使其能够像传统调试器一样支持断点设置和步进操作,从而实现对 Python 程序正向执行预测与逆向状态推断的可靠建模,为构建具备模拟调试能力的智能体编程系统奠定了基础。
该论文通过新颖的道德权衡数据集发现,与人类不同,推理过程能显著提升大语言模型的诚实度,其根本原因在于欺骗性回答在表征空间中处于亚稳态,而推理生成的思维链通过遍历该空间将模型推向更稳定的诚实默认状态。
本文提出了 BEACON 方法,通过结合多视角 RGB-D 观测与视觉语言模型,在包含遮挡区域的局部鸟瞰图空间中预测语言条件导航的可行度热力图,从而显著提升了机器人在遮挡场景下的目标定位精度。
该研究通过将情感效价和唤醒度作为调节因子扩展“蜜蜂方程”,构建了一个基于智能体的群体决策模型,揭示了情感动态如何通过改变招募与抑制机制来影响群体共识的形成速度、结果偏差及非线性放大效应。
该研究通过引入大语言模型驱动的“视觉向导”并开展用户实验,发现盲人与低视力用户在社交虚拟环境中会根据情境将向导视为工具或伙伴,从而揭示了其作为 VR 无障碍解决方案的潜力与设计方向。
该论文通过引入“词袋超叠加”(BOWS)实验环境,揭示了在真实数据中特征相关性可使干扰变为建设性,从而促使模型将特征按共激活模式排列以形成语义聚类和循环结构,弥补了传统超叠加理论仅关注稀疏无相关特征的不足。
本文提出了两种基于神经网络和在线学习的变化点检测方法,它们具有线性计算复杂度,在合成及真实数据集上的实验表明其性能优于现有方法,并证明了算法的收敛性及其在特定条件下优于离线方法的优势。
本文综述了自动化强化学习(AutoRL)的相关文献,涵盖了从 MDP 建模、算法选择到超参数优化的自动化工具及基于大语言模型的最新技术,并探讨了该领域的未来挑战与研究方向。
该论文提出了一种将数据不确定性作为额外输入的可解释子序列模型,在保持与最先进方法相当分类性能的同时,解决了现有可解释时间序列方法在处理天文不确定时间序列时性能不足的问题,并能为天体物理理论建模提供新的见解。
本文综述了大型语言模型(LLM)的最新进展,系统介绍了其背景、关键发现及主流技术,重点围绕预训练、适应微调、应用利用和能力评估四大核心方面展开,并总结了相关资源与未来挑战。