Leveraging Wikidata for Geographically Informed Sociocultural Bias Dataset Creation: Application to Latin America

该论文提出利用维基百科、Wikidata 知识图谱及社会科学专家知识构建了包含 2.6 万条多语言问答的"LatamQA"数据集,用于评估大语言模型在拉丁美洲不同国家及语言(西班牙语、葡萄牙语)背景下的表现,揭示了模型在区域知识掌握度、语言原生优势以及对伊比利亚文化相较于拉美本土文化的认知偏差等方面的显著不平等。

Yannis Karmim (ALMAnaCH), Renato Pino (UCHILE), Hernan Contreras (UCHILE), Hernan Lira (CENIA), Sebastian Cifuentes (CENIA), Simon Escoffier (PUC), Luis Martí (UP4, ALPAGE), Djamé Seddah (UP4, ALPAGE), Valentin Barrière (UCHILE, CENIA)2026-03-12💬 cs.CL

SpreadsheetArena: Decomposing Preference in LLM Generation of Spreadsheet Workbooks

本文介绍了 SpreadsheetArena 平台,通过盲测 pairwise 评估来研究大语言模型在生成满足用户显性及隐性约束的电子表格工作簿时的表现,揭示了不同场景下偏好特征的显著差异以及现有模型在金融等专业领域最佳实践对齐方面的不足。

Srivatsa Kundurthy, Clara Na, Michael Handley, Zach Kirshner, Chen Bo Calvin Zhang, Manasi Sharma, Emma Strubell, John Ling2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

该论文提出了个性化组相对策略优化(P-GRPO)框架,通过将优势估计与当前批次统计解耦并基于特定偏好群体的奖励历史进行归一化,有效解决了标准 GRPO 在异质偏好对齐中因假设样本可交换而导致的偏差问题,从而实现了对多样化用户偏好的更快速收敛和更精准对齐。

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

本文提出了 LWM-Temporal,这是一种面向无线信道时空特性的任务无关基础模型,它通过引入符合物理传播规律的稀疏时空注意力机制(SSTA)和基于物理信息的自监督预训练策略,显著降低了计算复杂度并学习到了可迁移的通用信道表征,从而在多种移动性场景下的信道预测任务中实现了优于基线的性能。

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

该论文在 NetSecGame 环境中评估了自主网络攻击代理在目标 IP 地址重分配场景下的泛化能力,发现尽管提示驱动的预训练大语言模型在未见地址空间下取得了最高成功率,但传统元学习代理仅表现出部分迁移能力,且所有方法均面临推理成本、可解释性或执行稳定性等方面的显著权衡。

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Gated Adaptation for Continual Learning in Human Activity Recognition

本文提出了一种基于通道门控调制的参数高效持续学习框架,通过冻结预训练骨干网络并仅学习对角缩放因子,在无需数据回放的情况下有效平衡了人类活动识别中的稳定性与可塑性,显著降低了灾难性遗忘并提升了模型在连续新主体任务上的最终准确率。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG