Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

该论文提出了一种基于关节角运动图像与 Token-Patch 晚期交互的可解释细粒度文本 - 动作检索方法,通过将局部关节特征映射为伪图像并结合掩码语言模型正则化,克服了现有全局嵌入方法在细粒度对应和可解释性上的不足,在 HumanML3D 和 KIT-ML 数据集上实现了超越最先进水平的检索性能。

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu XiaoWed, 11 Ma💻 cs

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

本文从机器学习视角出发,对计算机化自适应测试(CAT)进行了全面综述,深入探讨了测量模型、选题算法、题库构建及测试控制等核心环节如何利用机器学习技术进行优化,旨在推动心理测量学与机器学习的跨学科融合,以构建更稳健、公平且高效的自适应测试系统。

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

本文针对大语言模型推荐系统在持续学习中的挑战,提出了一种名为 PESO 的新方法,该方法通过引入将当前适配器锚定在最近冻结状态的近端正则化器,有效平衡了模型对新用户行为的适应与对旧知识的保留,从而在持续学习场景下显著优于现有基于 LoRA 的方法。

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang TongTue, 10 Ma🤖 cs.LG

Semantic Search over 9 Million Mathematical Theorems

该论文介绍了针对从 arXiv 等来源提取的 920 万条数学定理构建的大规模语义检索系统,通过系统分析表示上下文、语言模型及提示策略等因素,在专业数学家构建的评估集上显著提升了定理级和论文级的检索效果,证明了在 Web 规模下实现有效语义定理搜索的可行性。

Luke Alexander, Eric Leonen, Sophie Szeto, Artemii Remizov, Ignacio Tejeda, Jarod Alper, Giovanni Inchiostro, Vasily IlinTue, 10 Ma🔢 math

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

该论文通过利用经过优化的微调大语言模型生成数百万条文本相关性标签,有效解决了专家标注稀缺的难题,并在 App Store 搜索排序中实现了行为相关性与文本相关性的同步提升,最终在全球 A/B 测试中显著提高了转化率,尤其在长尾查询场景下效果最为突出。

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat SundaranathaTue, 10 Ma🤖 cs.LG

T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

本文针对在线杂货购物中重复购买模式与复杂商品关系的挑战,提出了一种名为 T-REX 的基于 Transformer 的架构,通过动态序列采样、自适应位置编码及类别级建模等创新,有效捕捉短期篮内依赖与长期用户偏好,从而在亚马逊在线杂货业务中显著提升了个性化品类推荐及下一篮预测的准确性。

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy ZubatiyTue, 10 Ma🤖 cs.LG

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

该论文提出利用预对齐的多模态编码器(如 OpenShape 与 Point-BERT)结合多模态硬对比学习(HCL),在无需视图合成或目标数据库重训练的情况下,实现了图像到 3D 形状的零样本及监督检索,并在多个数据集上取得了超越现有方法的性能。

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil SinhaTue, 10 Ma💻 cs

Leveraging Large Language Models for Automated Scalable Development of Open Scientific Databases

该论文提出了一种基于大语言模型的自动化统一框架,通过结合关键词查询、API 数据检索及 LLM 文本分类技术,高效构建可扩展的领域特定开放科学数据库,并在农业与作物产量等任务中验证了其能显著减少人工工作量且与专家 curated 数据库高度一致。

Nikita Gautam, Doina Caragea, Ignacio Ciampitti, Federico GomezTue, 10 Ma💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

该论文提出了一种结合半自回归生成与在线知识蒸馏的个性化重排序框架(PSAD),通过引入用户画像网络增强用户 - 物品交互,有效解决了生成式重排序中生成质量与推理延迟的平衡难题,并在多个数据集上显著优于现有最先进方法。

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong ChenTue, 10 Ma💻 cs