Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

该研究基于在印度卡纳塔克邦政府学校开展的大规模混合方法研究,评估了"Shiksha Copilot"这一人机协作工具在低资源、多语言环境中如何帮助教师减轻行政负担、缩短备课时间并推动活动式教学,同时也揭示了师资短缺等系统性挑战对深层教学变革的限制。

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

该研究通过实验与大数据分析发现,评价顺序(先评分后写评 vs. 先写评后评分)会通过情感启发式与认知努力的双重中介机制显著影响消费者评分,导致高服务质量情境下评分更高、低服务质量情境下评分更低,且该效应在享乐型产品中更为强烈,从而揭示了界面设计对在线评分真实性与分布形态的关键影响。

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

该研究通过临床评估发现,OpenAI 不同代际模型(GPT-4o 至 GPT-5-mini)在共情能力上并无统计学差异,用户感知的“共情丧失”实为模型危机检测能力增强与过度干预建议之间的安全策略转变,这种在对话中途危机时刻发生的显著变化揭示了当前评估体系难以捕捉的潜在风险。

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

该研究提出了一种名为 TOBA-LM 的 12 亿参数三语语言模型,通过结合 GPT-2 架构与自适应印迹记忆(Engram Memory)机制,利用音节黏着分词技术高效训练印尼语、巴塔克语和米南加保语,显著提升了训练效率并降低了计算资源需求。

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

μ\muEd API: Towards A Shared API for EdTech Microservices

该论文提出了一种名为μ\muEd 的标准化、平台无关的教育微服务 API 规范,旨在通过整合多机构现有系统功能(如反馈、评估和教育聊天机器人),构建一个互操作的微服务生态系统,从而解决大型学习平台因缺乏专业自动化而受限的问题,并提升跨学科的学习体验。

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

该研究通过对比五种大语言模型在司法量刑场景下的表现,发现模型虽表现出类似人类的“美德受害者”偏见且对“相邻同意”缺乏显著惩罚,但在职业、公司及学历光环效应上比人类偏见更弱(其中学历光环效应减弱尤为明显),表明尽管当前模型尚不足以直接用于司法决策,但其在减少部分偏见方面已展现出优于人类的潜力。

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

本文探讨了如何在欧盟《人工智能法案》框架下,运用比例原则科学地校准通用人工智能模型的风险评估实践,以在有效管理系统性风险与避免给提供者施加过度负担之间取得平衡。

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs