Community-Informed AI Models for Police Accountability

本文提出了一种由社区参与的多视角人工智能开发方法,旨在通过分析洛杉矶警察局执法记录仪视频来增强政府问责制,并强调了社会科学家在将多元利益相关者视角融入警务问责 AI 工具研发中的关键作用。

Benjamin A. T. Grahama, Lauren Brown, Georgios Chochlakis, Morteza Dehghani, Raquel Delerme, Brittany Friedman, Ellie Graeden, Preni Golazizian, Rajat Hebbar, Parsa Hejabi, Aditya Kommineni, Mayagüez Salinas, Michael Sierra-Arévalo, Jackson Trager, Nicholas Weller, Shrikanth NarayananFri, 13 Ma⚡ eess

"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue

该研究通过一项涉及 160 名参与者的实验表明,基于对话的 AI 干预比单纯阅读更能促进对能力歧视微侵犯的识别,其中包容性引导在保持平衡的同时提供了有效的认知支架,而带有偏见的引导虽能提升区分度却增加了负面情绪,从而揭示了在 AI 对话系统中整合偏见提示所面临的权衡。

Atieh Taheri, Hamza El Alaoui, Patrick Carrington, Jeffrey P. BighamFri, 13 Ma🤖 cs.AI

Locating Demographic Bias at the Attention-Head Level in CLIP's Vision Encoder

该论文提出了一种结合投影残流分解、零样本概念激活向量和偏置增强文本跨度分析的机械可解释性审计方法,成功在 CLIP 视觉编码器的注意力头级别定位了职业分类中的性别偏见(通过消融特定头可显著降低偏见并提升准确率),同时发现年龄偏见在该模型中呈现更弥散的分布特征。

Alaa Yasser, Kittipat Phunjanna, Marcos Escudero Viñolo, Catarina Barata, Jenny Benois-PineauFri, 13 Ma🤖 cs.AI

The impact of AI and peer feedback on research writing skills: a study using the CGScholar platform among Kazakhstani scholars

该研究利用 CGScholar 平台对 36 名哈萨克斯坦学者进行调查,发现人工智能工具的熟悉度与接受反馈的意愿呈中等正相关,而研究写作经验则与对同行反馈(尤其是方法论方面)的期望呈强正相关,表明将 AI 辅助与传统同行反馈相结合能有效提升学术写作质量。

Raigul Zheldibayeva2026-03-10🤖 cs.AI

Advancing Problem-Based Learning in Biomedical Engineering in the Era of Generative AI

该研究通过佐治亚理工学院与埃默里大学联合项目为期三年的案例,展示了一种针对生物医学人工智能优化的进阶问题式学习(PBL)框架,有效克服了学生背景差异、资源限制及数据隐私等挑战,显著提升了学生的批判性思维、科研产出及解决真实生物医学问题的能力。

Micky C. Nnamdi, J. Ben Tamo, Benoit Marteau + 2 more2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

该论文提出了一种结合动态认知情感模型与临床风险本体的自动化红队测试框架,通过大规模模拟实验揭示了当前大语言模型在心理健康支持中存在验证患者妄想及未能有效干预自杀风险等严重安全隐患,并验证了该框架在帮助多方利益相关者审计 AI 心理治疗“黑箱”方面的有效性。

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Baseline Performance of AI Tools in Classifying Cognitive Demand of Mathematical Tasks

该研究评估了 11 种通用及教育专用 AI 工具对数学任务认知需求的分类能力,发现其平均准确率仅为 63%,且普遍存在倾向于中间类别、过度依赖表面文本特征而忽视深层认知过程的系统性偏差,表明当前 AI 工具尚不足以直接替代教师进行此类专业判断。

Danielle S. Fox, Brenda L. Robles, Elizabeth DiPietro Brovey + 1 more2026-03-06💻 cs

Reckless Designs and Broken Promises: Privacy Implications of Targeted Interactive Advertisements on Social Media Platforms

该论文指出,TikTok、Facebook 和 Instagram 等社交平台允许第三方针对敏感属性投放可互动的定向广告,其默认设计导致广告主能查看互动用户的个人资料,从而违背了平台保护用户数据隐私的承诺,并建议通过设计改进来增强用户对互动后果的知情权以防止信息泄露。

Julia B. Kieserman, Athanasios Andreou, Laura Edelson, Sandra Siby, Damon McCoy2026-03-06🔒 cs.CR