Credibility Governance: A Social Mechanism for Collective Self-Correction under Weak Truth Signals

本文提出了一种名为“可信度治理”(Credibility Governance)的社会机制,通过动态评估并奖励与公共证据长期一致的参与者及观点,有效克服了在线平台在弱真理信号下因噪音、误导和操纵导致的集体判断脆弱性,从而显著提升了群体在不确定环境下的自我纠错能力与鲁棒性。

Wanying He, Yanxi Lin, Ziheng Zhou + 5 more2026-03-04💬 cs.CL

HateMirage: An Explainable Multi-Dimensional Dataset for Decoding Faux Hate and Subtle Online Abuse

本文提出了 HateMirage 数据集,该数据集通过从事实核查来源识别被广泛辟谣的虚假信息并追踪相关 YouTube 评论,构建了包含 4,530 条注释的“伪仇恨”语料,旨在通过目标、意图和影响三个可解释维度,推动对基于虚假叙事产生的微妙仇恨言论的检测与推理研究。

Sai Kartheek Reddy Kasu, Shankar Biradar, Sunil Saumya + 1 more2026-03-04💬 cs.CL

Graph-GRPO: Stabilizing Multi-Agent Topology Learning via Group Relative Policy Optimization

本文提出了 Graph-GRPO 框架,通过引入组相对策略优化(Group Relative Policy Optimization)对多智能体通信拓扑进行相对性能评估,有效解决了传统强化学习方法中因任务难度差异导致的梯度方差大和信用分配困难问题,从而显著提升了基于大语言模型的多智能体系统的训练稳定性与通信拓扑学习效率。

Yueyang Cang, Xiaoteng Zhang, Erlu Zhao + 7 more2026-03-04💬 cs.CL