SalamahBench: Toward Standardized Safety Evaluation for Arabic Language Models
本文提出了首个针对阿拉伯语语言模型的安全基准测试框架 SalamahBench,通过涵盖 12 个危害类别的 8170 个提示,系统评估了现有模型的安全对齐差异,并揭示了专用防护模型在安全性判断上优于原生模型,从而强调了针对阿拉伯语模型进行类别感知安全评估及部署专门防护机制的必要性。
7043 篇论文
本文提出了首个针对阿拉伯语语言模型的安全基准测试框架 SalamahBench,通过涵盖 12 个危害类别的 8170 个提示,系统评估了现有模型的安全对齐差异,并揭示了专用防护模型在安全性判断上优于原生模型,从而强调了针对阿拉伯语模型进行类别感知安全评估及部署专门防护机制的必要性。
本文提出了名为 DynaKV 的新型后训练框架,通过根据语义动态分配各 Token 的压缩率来实现低秩 KV 缓存压缩,在显著降低显存占用的同时保持了优于现有最先进方法的生成质量。
本文提出了一种名为“归纳概念评级”(ICR)的混合方法评估框架,通过结合符号学、诠释学与定性分析,揭示了大型语言模型在生成文本摘要时虽具备高语言相似度,却在捕捉语境化语义和深层意义方面存在显著不足,从而论证了超越传统词汇相似性指标、采用系统性定性解释实践来评估机器生成内容意义的必要性。
该论文提出了一种名为 FreST Loss 的频域增强训练目标,通过联合傅里叶变换将监督信号扩展至联合时空频谱,从而有效解耦复杂的时空依赖关系并降低估计偏差,在多种真实数据集上显著提升了现有模型的预测性能。
该研究通过大规模实验证实,视觉语言模型中的功能 affordance 计算具有显著的情境依赖性,其词汇和语义层面的表征均随情境发生巨大漂移,从而建议机器人学应从静态世界建模转向动态的即时本体投射(JIT Ontology)。
该研究通过对比实验证明,在临床诊断中采用混合厂商(如 o4-mini、Gemini-2.5-Pro 和 Claude-4.5-Sonnet)的多智能体大语言模型系统,能够通过整合互补的归纳偏置来克服单一厂商团队的共性偏差,从而显著提升诊断的召回率与准确率。
本文提出了 FedEMA-Distill,一种通过结合全局模型指数移动平均与基于公共代理数据集的客户端预测 logits 集成知识蒸馏的服务器端方法,在无需修改客户端软件且支持模型异构的前提下,显著提升了联邦学习在非独立同分布数据及拜占庭攻击下的准确率、收敛速度并大幅降低了通信开销。
该研究提出了一种结合低秩适应(LoRA)微调与合规感知自指令(Self-Instruct)方法的框架,通过集成26项过滤验证流程,在严格遵循国际海事组织标准海事通信用语(SMCP)的前提下,高效生成了高质量、多样化的合成海事无线电对话数据集,以解决安全关键领域数据稀缺的难题。
本文提出了 Delta-Crosscoder 模型,通过结合 BatchTopK 稀疏性、基于差异的损失函数及隐式对比信号,在狭窄微调场景下成功克服了现有交叉编码器方法的局限,能够更精准地识别并干预导致模型行为变化的潜在方向。
该论文提出并验证了“查询与键应低维化而值保持高维”的非对称注意力机制,通过降低键的维度或进行 SVD 压缩配合微调,在仅带来极小性能损失的前提下显著减少了 KV 缓存占用,从而大幅提升了大模型的并发服务能力。
该论文提出了一种面向边缘设备多 Agent LLM 推理的持久化 4 位 KV 缓存机制,通过将缓存量化存储于磁盘并直接注入注意力层,在显著降低显存占用(FP16 的 1/4)的同时,消除了重复预填充计算,使首词生成延迟降低了最高 136 倍且保持了可接受的困惑度。
该论文提出了“缺失内容(WIM)”评分系统,通过让评判者撰写关于模型输出缺失信息的自然语言反馈,并利用句子嵌入计算其与输出的余弦相似度来生成可解释的评分,从而克服了传统离散数值评分的主观性局限,为偏好学习提供了更丰富且可调试的学习信号。
本文提出了 SOLID,一种仅需稀疏观测数据进行端到端训练的掩码条件时空场扩散框架,通过双掩码目标在无需稠密场先验的情况下实现了对物理场的精确重构与校准的不确定性量化。
本文提出了 ZorBA,一种基于零阶优化与异构块激活机制的联邦大语言模型微调框架,通过消除客户端梯度存储、动态分配 Transformer 块以及利用共享随机种子降低通信开销,在显著减少显存占用的同时提升了收敛效率。
本文提出了一种名为 ASFL 的自适应模型拆分与资源分配框架,通过利用服务器算力进行部分模型训练并结合在线优化增强的块坐标下降算法,有效解决了无线联邦学习中的延迟与能耗问题,在提升收敛速度的同时显著降低了训练延迟和能耗。
本文提出了 CogGen,一种受认知负荷启发的完全无监督深度生成模型,通过自-paced 课程学习策略将 k 空间数据拟合从均匀处理转变为“由易到难”的渐进式调度,从而在压缩采样 MRI 重建中有效缓解过拟合并提升收敛速度与重建 fidelity。
本文基于康德的概念知识理论构建了一个可执行的认知系统,通过其学习、情感与信息操纵等计算机制,系统地解释了包括知觉辨别、信息整合、注意力及睡眠差异在内的意识“简单问题”。
本文提出了 AMV-L 框架,通过基于效用值的生命周期管理和受控检索集大小,解决了长周期 LLM 代理因内存无限累积导致的尾部延迟问题,在保持检索质量的同时显著提升了系统吞吐量并大幅降低了极端延迟。
本文介绍了 vLLM 语义路由器,这是一种基于信号驱动的决策路由框架,通过组合从启发式特征到神经分类器的异构信号来动态选择混合模态模型,从而在单一架构下灵活支持多场景部署并满足成本、隐私及安全等差异化策略需求。
本文提出了 SkillNet,一个旨在通过统一本体论从异构来源创建、评估和组织 AI 技能的大规模基础设施,其包含的 20 万 + 技能库及评估体系显著提升了智能体在多项任务中的表现,使其平均奖励提高 40% 并减少 30% 的执行步骤。