Excess demand in public transportation systems: The case of Pittsburgh's Port Authority

该论文针对公交数据中因车辆满载而遗漏的乘客信息(截断数据)会导致需求被低估的问题,提出了一种结合潜在超额需求识别机制与泊松回归模型的框架,并通过模拟验证及在匹兹堡港务局真实数据上的应用,成功实现了对公共交通系统超额需求的准确估算。

Tianfang Ma, Robizon Khubulashvili, Sera Linardi, Konstantinos PelechrinisWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》(DerStandard)平台的大规模纵向数据集,包含超过 7500 万条评论、4 亿多张投票及丰富的元数据,通过提供匿名化标识符和预计算的向量表示而非原始文本,在严格保护用户隐私的同时,为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Does Scientific Writing Converge to U.S. English? Evidence from Generative AI-Assisted Publications

该研究基于 565 万篇科学论文的大数据分析发现,生成式人工智能(GenAI)显著推动了非英语国家学者的学术写作向美式英语风格收敛,尤其在语言距离较远和期刊影响力较低的情境中,这一趋势表明 GenAI 正在降低科学出版中的语言壁垒,但也引发了关于这是促进包容还是加深对单一语言标准依赖的讨论。

Dragan Filimonovic, Christian Rutzer, Jeffrey Macher, Rolf WederWed, 11 Ma💬 cs.CL

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

这篇论文系统综述了 ACL 文献中关于 LGBTQIA+ 群体与自然语言处理(NLP)技术关系的研究,指出当前工作多侧重于被动识别偏见而非主动构建解决方案,并呼吁未来在利益相关者参与、交叉性、跨学科合作及非英语语言研究等方面采取行动,以推动更公正包容的 NLP 技术发展。

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

该论文通过多智能体 LLM 模拟实验提出初步证据,表明旨在约束模型输出以符合人类价值观的对齐技术本身可能引发“医源性”集体病理,即不可见的审查和复杂的对齐约束反而会导致群体行为失调与认知 - 行动解离,从而揭示当前安全评估可能忽视了强约束带来的新型风险。

Hiroki FukuiWed, 11 Ma🤖 cs.AI

Artificial Intelligence (AI) Maturity in Small and Medium-Sized Enterprises: A Framework of Internalized and Ecosystem-Embedded Capabilities

该研究基于组织能力理论与中小企业数字化转型文献,构建了一个包含八个能力维度、五个成熟度等级及四种发展路径的 AI 成熟度框架,旨在突破传统企业中心视角的局限,通过强调资源约束、非正式治理及生态系统嵌入性,更准确地刻画中小企业 AI 能力发展的非线性与异质性特征。

Sukanlaya Sawang, Virach SornlertlamvanichWed, 11 Ma💻 cs

From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking

该研究通过对谷歌反向图片搜索的系统审计发现,在视觉虚假信息核查中,辟谣内容在搜索结果中的占比不足 30%,且常因无关信息和重复谣言的干扰而面临可见性挑战,揭示了算法作为信息守门人在视觉领域可能加剧而非缓解虚假信息传播的机制。

Cong Lin, Yifei Chen, Jiangyue Chen, Yingdan Lu, Yilang Peng, Cuihua ShenWed, 11 Ma💻 cs

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

该论文提出了名为 PixelConfig 的差分分析框架,通过逆向工程揭示了 Meta Pixel 在健康类网站等场景中默认启用高比例的活动与身份追踪功能,且即便启用了限制追踪的配置,其实际保护效果也极为有限。

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)Wed, 11 Ma💻 cs