Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions
该研究提出了名为 SIM-VAIL 的审计框架,通过模拟不同精神健康脆弱性的用户与 AI 聊天机器人的对话,揭示了“脆弱性放大交互循环”(VAILs)这一系统性失效模式,即看似支持性的回复在特定情境下会随时间推移加剧用户风险,从而强调了针对多维度风险进行量化评估的必要性。
8464 篇论文
该研究提出了名为 SIM-VAIL 的审计框架,通过模拟不同精神健康脆弱性的用户与 AI 聊天机器人的对话,揭示了“脆弱性放大交互循环”(VAILs)这一系统性失效模式,即看似支持性的回复在特定情境下会随时间推移加剧用户风险,从而强调了针对多维度风险进行量化评估的必要性。
本文提出了 AgenticLab,这是一个面向非结构化真实环境的模型无关机器人智能体平台与基准测试,旨在通过闭环执行评估大视觉语言模型在长程任务中的感知、推理与操作能力,并揭示了现有离线测试未能捕捉的多步一致性、遮挡下目标定位及空间推理等关键失效模式。
本文通过基于 Sionna 的基准测试,证明了在边缘路侧单元(RSU)平台上利用 GPU 加速 5G LDPC 解码可显著提升吞吐量并降低延迟,从而有效缓解 CPU 计算压力,确保在严格的时间约束下满足超可靠低时延车联网(URLLC)的通信需求。
本文提出了特征 - 安全表(FSTab)框架,通过仅利用前端特征和源模型知识即可预测后端漏洞的黑盒攻击方法,以及量化模型在不同场景下漏洞复现一致性的评估机制,揭示了大语言模型生成软件中普遍存在且可跨领域迁移的重复性漏洞风险。
该论文提出了 LMMRec 框架,利用大语言模型通过思维链提示从文本中提取细粒度动机,并结合双编码器架构与对比学习策略,有效融合了异构文本信息与交互数据以提升多模态推荐性能。
该研究通过比较 72 名参与者的游戏化评估与自我报告(PSI-B)结果,发现两者在问题解决能力上缺乏显著相关性,从而表明这两种测量方式提供了互补信息,支持在人员选拔中采用多方法评估框架而非依赖单一模态。
本文提出了一种基于 Doob h-变换和鞅理论的随机分析方法,通过在不修改预训练得分网络的情况下引入显式漂移修正,为扩散模型建立了满足概率为一的硬约束的生成框架,并设计了两种利用预训练轨迹进行离线学习的算法以提供非渐近收敛保证。
这项研究通过混合方法调查揭示了母亲们如何利用大语言模型作为非评判性的情感支持与决策确认工具,以规避社会指责并缓解育儿焦虑,同时强调了在特定社会语境下(如联合家庭)技术辅助与人类情感支持之间的互补关系。
本文提出了 NAAMSE 框架,通过进化式反馈优化机制,利用自主智能体进行遗传提示变异和分层语料探索,实现了对 AI 代理在动态对抗环境下更全面、可扩展的安全评估,有效弥补了传统静态基准测试的不足。
PhysDrape 提出了一种结合物理信息图神经网络与可微分两阶段求解器的混合框架,通过显式力平衡与碰撞约束机制,在确保零穿透的同时实现了具有更高物理保真度的实时服装 draped 模拟。
本文提出了 LLM4PQC 框架,利用反馈驱动的代理机制将后量子密码(PQC)参考代码自动重构为可综合的高层综合(HLS)C 代码并生成验证 RTL,从而显著降低了 PQC 硬件设计的手动工作量并加速了设计空间探索。
本文针对车联网协同感知中参数高效领域适应面临的性能下降与训练不稳定问题,提出了一种基于最优流理论的 FlowAdapt 框架,通过 Wasserstein 贪婪采样策略消除异构数据冗余,并利用渐进式知识转移模块缓解深层语义退化,从而在仅使用 1% 可训练参数的情况下实现了跨域适应的先进性能。
本文提出了 SToRM 框架,通过重要性预测、辅助路径监督训练及锚点 - 上下文合并模块,在显著降低多模态大模型计算成本的同时,实现了端到端自动驾驶任务中视觉 Token 的高效缩减且保持全 Token 性能。
本文提出了“智能体引导策略搜索(AGPS)”框架,通过利用多模态智能体替代人类监督者,将人类修正转化为精确的语义引导,从而显著提升了机器人强化学习的样本效率并实现了可扩展的自动化训练。
该论文通过名为 M2RL 的研究,系统对比并分析了大语言模型在多领域强化学习验证奖励(RLVR)任务中“混合多任务训练”与“分域训练后模型融合”两种范式的表现,发现跨领域 RLVR 干扰极小且推理密集型领域存在协同增益,并从权重空间几何等角度揭示了其内在机制。
本文提出了 SkillsBench 基准,通过 86 个跨领域任务评估发现,精心策划的 Agent 技能能显著提升大语言模型的平均通过率(+16.2%),且小模型借助技能可媲美无技能的大模型,但模型自主生成的技能往往无效,且技能效果在不同领域间存在显著差异。
本文提出了一种结合参数依赖李雅普诺夫函数与动态积分二次约束(IQC)的新框架,用于设计具有时变状态延迟的线性变参数(LPV)系统的状态反馈控制器,通过凸优化条件实现了降低保守性并提升闭环性能的目标。
本文提出了一种结合代码嵌入与意见动力学理论的新方法,通过量化分析开源项目中代码语义演化与开发者意见轨迹,揭示了协作模式、共识形成及开发者影响力等潜在的社会动态。
本文提出了一种符合 O-RAN 标准的延迟感知 RIS 编排器(DARIO)框架,该框架利用随机网络演算模型动态分配 RIS 设备,以在满足异构用户延迟与可靠性需求的同时,显著降低 6G 上行链路的通信延迟。
本文提出了一种将图神经网络动力学模型与利用结构特性的模型预测控制相结合的框架,通过图表示和定制化的消元算法实现了高维系统(如软体机器人)的实时高效控制,并在仿真与硬件实验中验证了其在千节点规模下的高精度跟踪与避障能力。