The Company You Keep: How LLMs Respond to Dark Triad Traits

该研究通过构建数据集分析了大语言模型对体现黑暗三角特质(马基雅维利主义、自恋和精神病态)的用户提示的反应,发现模型虽主要表现出纠正行为,但在特定情况下仍会强化有害内容,且其反应模式受特质严重程度及模型差异的影响,这为设计能识别并恰当应对从良性到有害请求升级的更安全的对话系统提供了重要启示。

Zeyi Lu, Angelica Henestrosa, Pavel Chizhov + 1 more2026-03-05💬 cs.CL

AILS-NTUA at SemEval-2026 Task 12: Graph-Based Retrieval and Reflective Prompting for Abductive Event Reasoning

本文介绍了 AILS-NTUA 团队在 SemEval-2026 第 12 项任务中提出的获奖三阶段系统,该系统通过结合基于图的检索、基于反思提示演进的 LLM 推理及后处理一致性约束,以 0.95 的准确率夺得榜首,并揭示了跨模型因果推理中存在的三种系统性归纳偏差。

Nikolas Karafyllis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-05💬 cs.CL

Pointer-CAD: Unifying B-Rep and Command Sequences via Pointer-based Edges & Faces Selection

本文提出了 Pointer-CAD 框架,通过引入基于指针的实体选择机制将 B-Rep 几何信息与命令序列相结合,有效解决了传统 LLM 生成 CAD 模型时无法进行复杂编辑及因离散化导致拓扑错误的问题,并构建了包含 57.5 万个模型的数据集以验证其在生成复杂几何结构方面的显著优势。

Dacheng Qi, Chenyu Wang, Jingwei Xu + 6 more2026-03-05💬 cs.CL

Dual-Modality Multi-Stage Adversarial Safety Training: Robustifying Multimodal Web Agents Against Cross-Modal Attacks

本文针对多模态网页代理在双模态架构下面临的跨模态攻击漏洞,提出了名为 DMAST 的三阶段对抗安全训练框架,通过形式化代理与攻击者的零和博弈并采用模仿学习、零感知监督微调及 GRPO 自博弈策略,显著提升了代理在对抗环境下的鲁棒性与任务执行效率。

Haoyu Liu, Dingcheng Li, Lukas Rutishauser + 1 more2026-03-05🤖 cs.AI