GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification
该论文介绍了 GATech 团队在 AbjadGenEval 共享任务中利用多语言 E5-large 编码器检测阿拉伯语机器生成文本的方法,发现尽管尝试了多种复杂的池化策略,但简单的均值池化效果最佳(F1 达 0.75),且观察到人类文本通常比机器生成文本更长这一显著特征。
2315 篇论文
该论文介绍了 GATech 团队在 AbjadGenEval 共享任务中利用多语言 E5-large 编码器检测阿拉伯语机器生成文本的方法,发现尽管尝试了多种复杂的池化策略,但简单的均值池化效果最佳(F1 达 0.75),且观察到人类文本通常比机器生成文本更长这一显著特征。
该论文通过对比实验表明,在阿拉伯语医疗文本的 82 类细粒度分类任务中,经过混合池化和正则化策略微调的双向编码器(如 AraBERTv2)在捕捉精确语义边界方面显著优于基于因果解码的大语言模型。
该论文提出了个性化组相对策略优化(P-GRPO)框架,通过将优势估计与当前批次统计解耦并基于特定偏好群体的奖励历史进行归一化,有效解决了标准 GRPO 在异质偏好对齐中因假设样本可交换而导致的偏差问题,从而实现了对多样化用户偏好的更快速收敛和更精准对齐。
该论文通过系统梳理现有文献与法规,揭示了"AI 模型”与"AI 系统”定义模糊导致的监管义务分配难题,并提出了基于参数架构与组件集成的清晰概念及操作性定义,旨在解决 AI 价值链中责任界定的边界问题。
本文提出了 LWM-Temporal,这是一种面向无线信道时空特性的任务无关基础模型,它通过引入符合物理传播规律的稀疏时空注意力机制(SSTA)和基于物理信息的自监督预训练策略,显著降低了计算复杂度并学习到了可迁移的通用信道表征,从而在多种移动性场景下的信道预测任务中实现了优于基线的性能。
本文提出了 HTM-EAR,一种结合 HNSW 工作记忆与归档存储的分层记忆系统,通过重要性感知淘汰机制和混合路由策略,在长周期运行且上下文受限的饱和场景下,有效平衡了关键信息保留与陈旧记忆遗忘,显著优于传统 LRU 等基线方法。
Tureis 是一种面向智能家居边缘部署的自监督 Transformer 统一方法,它通过掩码重建机制和迭代隔离策略,在无需标签的情况下实现了对多故障、多住户场景下异构传感器故障的毫秒级检测与细粒度定位。
该论文在 NetSecGame 环境中评估了自主网络攻击代理在目标 IP 地址重分配场景下的泛化能力,发现尽管提示驱动的预训练大语言模型在未见地址空间下取得了最高成功率,但传统元学习代理仅表现出部分迁移能力,且所有方法均面临推理成本、可解释性或执行稳定性等方面的显著权衡。
该研究通过大规模对照实验发现,评估格式(如多项选择与开放式回答)对语言模型安全分数的影响远大于脚手架架构本身,且模型与脚手架之间存在显著的交互效应,导致无法建立通用的安全排名,因此必须针对特定模型和配置进行独立测试。
本文提出了一种基于通道门控调制的参数高效持续学习框架,通过冻结预训练骨干网络并仅学习对角缩放因子,在无需数据回放的情况下有效平衡了人类活动识别中的稳定性与可塑性,显著降低了灾难性遗忘并提升了模型在连续新主体任务上的最终准确率。
本文揭示了 Sharpness-Aware Minimization (SAM) 利用单步上升点梯度更新当前参数能更准确地逼近邻域内最大值的直观原理,并针对现有近似误差及多步上升带来的质量退化问题,提出了计算开销极低且性能更优的显式锐度感知最小化方法(XSAM)。
本文介绍了名为 InFusionLayer 的开源 Python 工具,该工具基于组合融合分析(CFA)中的秩分特征函数和认知多样性,构建了一种通用的机器学习架构,旨在通过融合多个基模型来优化监督与无监督的多分类问题,并已在多种计算机视觉数据集上验证了其易用性与有效性。
该论文指出将加密流量扁平化为字节序列会导致协议语义丢失,进而提出一种基于协议原生语义的表格化预训练范式 FlowSem-MAE,通过引入可预测性过滤、特定字段嵌入及双轴注意力机制,在仅使用一半标注数据的情况下显著优于现有最先进方法。
该论文提出了 OmniGuide 框架,通过将 3D 基础模型、语义推理大模型及人体姿态模型等多种引导源转化为可微的能量函数,显著提升了通用视觉 - 语言 - 动作(VLA)策略在复杂操作任务中的成功率与安全性。
本文提出了 CAADRL 框架,通过显式利用取送货问题(PDP)的多尺度聚类结构,结合集群感知编码与动态双解码器机制,在保持推理高效性的同时显著提升了求解性能。
该论文解决了作者关于二元贝叶斯网络中基于费雪信息度量的体积平均里奇标量是否普遍量子化为半整数的二十年猜想,通过通用 Beta 函数抵消机制证明了树结构和完全图情形下的成立,同时通过显式环路反例证伪了普遍性,并进一步揭示了离散比特网络与高斯网络之间曲率符号的二元对立。
该论文提出利用神经细胞自动机生成可控且廉价的合成非语言数据对大语言模型进行“预预训练”,结果发现仅使用 1.64 亿个合成 token 即可在语言建模和推理任务上取得优于 16 亿自然语言 token 预训练的效果,并揭示了注意力层的高可迁移性及不同领域对合成数据复杂度的差异化需求。
本文提出 HTMuon 算法,通过引入重尾谱校正机制解决 Muon 优化器过度抑制重尾权重谱的问题,在 LLM 预训练和图像分类任务中显著提升了性能并提供了相应的理论收敛保证。
该论文针对工具增强代理强化学习(TARL)中因重要性采样分布漂移导致的训练崩溃问题,提出了一种仅需一行代码修改即可实施的 SAPO 算法,通过条件性 KL 约束稳定训练,在多个基准测试中显著提升了搜索智能体的性能。
该研究首次将稀疏自编码器应用于时间序列基础模型 Chronos-T5,通过因果特征消融实验揭示了其内部存在从低频特征到关键突变检测的层级结构,并发现模型预测性能的核心驱动力并非最终层的语义丰富表征,而是中间层中负责检测突变动态的因果特征。