YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK
该论文介绍了专为英国穆斯林女性设计的文化敏感型代理 AI 应用"YAQIN",通过结合伊斯兰心理学与用户共创方法,利用基于检索增强生成的聊天机器人和引导式日记功能,有效填补了现有心理健康服务在文化适配性上的空白,从而提升了该群体的信任度与参与度。
11753 篇论文
该论文介绍了专为英国穆斯林女性设计的文化敏感型代理 AI 应用"YAQIN",通过结合伊斯兰心理学与用户共创方法,利用基于检索增强生成的聊天机器人和引导式日记功能,有效填补了现有心理健康服务在文化适配性上的空白,从而提升了该群体的信任度与参与度。
该研究通过在双臂老虎机任务中测试大语言模型,发现其在不同奖励条件下均表现出将位置偏好放大为僵化决策策略的鲁棒性偏差,且这种由低学习率和高逆温度导致的过度利用行为难以通过常规解码参数调整消除,进而揭示了这些偏差可能深刻影响人机协作的潜在机制。
该研究提出了一种新颖的多智能体架构,通过分工协作将用户描述转化为可执行的 OpenSeesPy 脚本,有效解决了大语言模型在复杂多步结构建模中的幻觉与误差累积问题,并在基准测试中实现了极高的准确率与可扩展性。
该论文通过构建涵盖多种问题类型和参数规模的自然语言离散优化数据集,评估了包括 Llama-3 系列和 ChatGPT 在内的不同大语言模型及思维链(CoT)方法的性能,发现强模型表现更优但 CoT 并非总是有效,且数据扰动虽能提升简单问题的表现却引入了不稳定性,从而为自动化求解离散优化问题提供了基准评估与实用建议。
本文提出了一种名为 FedShift 的新型两阶段“藏与寻”分布式对抗攻击方法,通过在联邦图学习训练前注入隐藏移位器并在训练后利用全局模型高效生成扰动,在显著降低时间成本的同时实现了高攻击成功率并有效规避了主流防御算法。
该论文提出了一种名为 DECADE 的无监督扩散模型,通过引入时间一致性约束,有效解决了铷 -82 动态心脏 PET 成像中因缺乏配对数据和高噪声导致的去噪难题,在提升图像质量的同时保持了血流动力学参数的定量准确性。
本文介绍了 QuadAI 团队在 SemEval-2026 任务 3 中提出的系统,该系统通过集成学习将结合回归与分类头的混合 RoBERTa 编码器与大语言模型(LLM)相结合,利用预测级堆叠显著提升了多维方面情感分析的性能。
ProgAgent 提出了一种结合进度感知奖励学习与 JAX 原生高吞吐架构的持续强化学习智能体,通过从无人标注专家视频中提取密集奖励、引入对抗性正则化以应对分布偏移,并融合 PPO 与核心集回放等机制,有效解决了机器人终身学习中的灾难性遗忘与奖励指定难题,在多个基准测试及真实机器人任务中显著超越了现有基线。
该研究通过双指标评估框架,在尼泊尔文化语境下分析了七种大语言模型的社会偏见,发现显式同意偏见与隐式生成偏见存在显著差异且后者受温度参数非线性影响,揭示了当前模型在欠代表文化背景中偏见评估的局限性及去偏策略的紧迫性。
本文提出了一种将物理信息神经网络推广至非线性偏微分方程的方法,通过多头架构和正交约束构建鲁棒的解空间嵌入,并利用主成分分析成功提取了粘滞 Burgers 方程中由少量潜在模式主导的物理特征。
本文提出了 HybridStitch,一种将图像生成视为编辑任务的新型文生图范式,通过在像素和 timestep 级别动态划分难易区域并协同使用大模型与小模型,实现了比现有混合模型方法更快的推理加速(在 Stable Diffusion 3 上达到 1.83 倍提速)。
本文针对微交通分区问题,通过引入全局预算约束并设计列生成框架及定价启发式算法,提出了一种比现有枚举方法更高效、可扩展性更强且能生成更优解的优化方案。
本文提出了一种名为“梯度迭代时序差分学习”的新算法,通过计算移动目标的梯度来改进迭代 TD 学习,使其在保持梯度 TD 方法稳定性的同时,在 Atari 等多个基准测试中展现出与半梯度方法相媲美的学习速度。
该论文主张将教育中的 AI 滥用问题从“检测难题”重新定义为“测量难题”,并提出以“学习可见性框架”为核心,通过明确 AI 使用规范、将学习过程视为评估证据以及建立透明的活动轨迹,在保障伦理与信任的前提下实现 AI 与教育的良性融合。
本文提出了名为 DistillGuard 的评估框架,系统测试了输出扰动、数据投毒和信息节流三类防御策略,发现除移除思维链能显著削弱数学推理能力外,大多数现有输出级防御在防止大语言模型知识蒸馏方面效果有限且高度依赖具体任务。
本文介绍了 AI Steerability 360,这是一个开源的 Python 工具包,旨在通过统一的管道接口和模块化设计,降低大语言模型在输入、结构、状态和输出四个控制维度上进行可控性调整与评估的门槛。
该论文通过在文本 RPG 中构建具有明确伦理基准的 36 种行为画像,系统研究了 LLM 代理如何分阶段推断目标特征并实施以“误导性陈述”为主(占 88.5%)而非捏造事实的有意欺骗,发现动机是主要攻击向量且现有事实核查防御难以应对此类策略性框架。
该论文提出了 SynPlanResearch-R1 框架,通过合成鼓励深度探索的工具使用轨迹来优化冷启动监督微调,从而有效解决了强化学习在研究智能体探索行为上的不足,并在多个基准测试中显著提升了基于 Qwen3 模型的研究性能。
该论文受生物睡眠机制启发,提出了一种名为“睡眠回放巩固”(SRC)的后训练校准方法,通过选择性回放内部表征来更新网络权重,从而在不依赖监督重训练的情况下显著提升人工神经网络的置信度校准能力。
该论文针对现有视觉语言模型在酒店决策领域信息实用性评估的不足,提出了“信息性”评估框架并构建了专用数据集,研究发现模型需经过适度的领域微调才能有效利用视觉信号进行决策导向的信息推理。