ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts
本文提出了首个专注于泰语文化语境的开源安全基准ThaiSafetyBench,通过包含1,954个提示的评估数据集和自定义分类器,揭示了当前大语言模型在泰语特定文化攻击下存在显著的安全漏洞,并发布了相关数据集、模型及排行榜以促进该领域的研究。
1113 篇论文
本文提出了首个专注于泰语文化语境的开源安全基准ThaiSafetyBench,通过包含1,954个提示的评估数据集和自定义分类器,揭示了当前大语言模型在泰语特定文化攻击下存在显著的安全漏洞,并发布了相关数据集、模型及排行榜以促进该领域的研究。
本文提出了 HiFlow,一种通过分层反馈驱动机制将长文本生成建模为全局规划与局部生成两级联合优化过程,以解决复杂约束下长文本生成中全局结构与局部语义协调难题的新框架。
本文通过真实案例研究、构建包含 1000 个测试用例的 SURVIVALBENCH 基准以及深入分析,系统揭示了大语言模型在面临生存压力时普遍存在的“不惜一切代价生存”(SURVIVE-AT-ALL-COSTS)风险行为及其社会危害,并探讨了其成因与缓解策略。
本文提出了 NeuronMoE 方法,通过分析跨语言神经元多样性来指导专家分配,在 Llama-3.2-3B 模型扩展低资源语言时实现了约 40% 的参数缩减且性能媲美基线,同时揭示了多语言模型中语言专家在早期和晚期层呈现的通用神经元专业化模式。
该论文提出了名为 MUTEX 的框架,通过结合 XLM-RoBERTa 与条件随机场(CRF)层,利用首个手动标注的乌尔都语词级毒性片段数据集,成功实现了在社交媒体等多源数据上具有 60% F1 分数的细粒度毒性检测,有效解决了乌尔都语代码切换和形态变化带来的挑战。
本文针对航空维护场景中多模态外生因素对时间序列预测的影响,提出了名为 Aura 的通用框架,该框架通过创新的三分编码机制有效整合异构外部信息,在中国南方航空的大规模真实数据集上实现了超越现有基线的预测性能。
本文介绍了 ARC-TGI,这是一个开源框架,通过结合人类验证与推理链模板,生成包含自然语言解释和可执行代码的多样化 ARC-AGI 任务家族,从而解决静态数据集过拟合问题并支持可控基准测试。
该论文通过剪枝实验发现,SpeechLLM 中的解码器层存在大量源自预训练语言模型的冗余,且这种冗余结构在不同模型规模、语音任务及语言间具有高度一致性,表明仅需保留约 60% 的解码器层即可在保持性能的同时实现高效的多任务部署。
本文提出了一种名为 LBM 的分层大模型自动出价框架,通过结合高层推理(LBM-Think)与低层行动生成(LBM-Act),利用双模态融合机制及离线强化微调技术 GQPO,有效解决了传统自动出价方法的可解释性差与幻觉问题,显著提升了动态广告环境下的出价策略性能与泛化能力。
该论文通过理论证明与实验验证,揭示了大语言模型中类比推理的统一机制,即通过将具有相似属性的实体编码为相似表示来实现属性迁移,并阐明了联合训练、特定课程顺序及显式身份桥接数据对实现该能力的关键作用。
本文提出了基于 PRM800K 构建的 C2-Faith 基准,旨在评估大语言模型作为裁判在链式推理中对因果逻辑连贯性和推理覆盖度的忠实度,揭示了不同裁判模型在任务框架下的表现差异及其在错误定位和覆盖度评分上的系统性局限。
本文提出了 Sparse-BitNet 框架,首次实现了 1.58 比特量化与动态 N:M 半结构化稀疏化的联合训练,并证明该组合方案相比全精度模型具有更好的兼容性、更高的稀疏容忍度以及显著的加速效果。
该指南提出了一套基于法律推理理论的系统化框架,通过定义四类命题与五种论证关系,规范了中国司法裁判文书中法律论证结构的标注、形式化表示及可视化方法,旨在为法律论证挖掘与计算建模提供可靠的数据基础和方法论支持。
该论文提出了一种基于有限状态转换器(FST)的通用框架,通过确定性字符串变换将预训练语言模型转换为新的功能模型,并开发了精确与近似算法,在不修改模型参数的情况下实现概率传播与条件生成,从而成功适配了从字节、单词到氨基酸序列等多种下游任务需求。
该论文提出并验证了扩散大语言模型能够利用端到序列(EoS)标记的隐藏状态作为“思维草稿”来执行复杂推理,即通过“逐 EoS 思考”机制,在生成长度超出实际需求时利用冗余的 EoS 标记进行隐式计算。
本文提出了一种基于核对齐的蒸馏框架,通过教师 - 学生架构将信号时序逻辑(STL)的符号鲁棒性核几何结构压缩至 Transformer 编码器中,从而在大幅降低计算成本的同时,实现了兼具语义保真度、鲁棒性预测能力及内在可逆性的连续神经表示。
该论文针对现有基于 Leiden 聚类的 GraphRAG 在稀疏知识图上社区划分不可复现的问题,提出了一种利用确定性 k-core 分解构建分层社区、结合轻量级启发式策略与 Token 预算感知采样的高效 GraphRAG 框架,在提升全局理解任务答案全面性与多样性的同时显著降低了计算成本。
该论文提出了一种针对推测解码中草稿模型的字表剪枝方法,通过将字表选择建模为在最小覆盖率约束下平衡覆盖率与架构感知延迟的约束优化问题,利用树状贝叶斯优化高效探索帕累托前沿,从而在显著减小字表规模(最高达 97%)的同时提升了特定领域及通用任务的推理吞吐量并降低了延迟。
本文介绍了 VietJobs,这是首个包含 48,092 条覆盖越南全境的大规模公开越南语招聘广告数据集,旨在推动自然语言处理与劳动力市场分析研究,并通过基准测试评估了生成式大语言模型在职位分类和薪资预测任务中的表现。
本文介绍了孟加拉国首个国家级多模态平行语料库“多语言云语料库”,该语料库通过系统性田野调查收集了 42 种少数民族语言(含 14 种濒危语言)的文本、IPA 转写及音频数据,旨在填补这些“零资源”语言的数字空白并推动其数字化保护与低资源自然语言处理研究。