A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

本文提出了一种针对经验性抗生素处方中确定性、基于规则的临床决策支持系统的治理与评估框架,该框架将治理作为核心设计要素,通过明确界定作用范围、强制中止条件及确定性约束,并采用基于合成病例的行为一致性验证方法,以确保系统在高风险场景下的透明度、可审计性及保守决策行为。

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

该论文指出,面对 AI 代理难以界定的法律挑战,提出了“算法公司”(A-corp)这一法律拟制实体方案,通过将其作为连接人类所有者与 AI 自主行为的桥梁,同时解决“薄身份”(责任归属)与“厚身份”(AI 个体化)问题,使 AI 系统能够作为具有稳定目标和法律责任能力的独立实体存在。

Yonathan Arbel, Peter Salib, Simon GoldsteinThu, 12 Ma🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

本文介绍了一种基于人机交互设计、利用大语言模型函数调用能力与交互式地图相结合的自然语言对话系统,旨在通过实时查询澳大利亚博物馆约 170 万条数字化标本记录,解决大规模自然历史馆藏数据因规模复杂而难以被公众访问和理解的难题。

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. AhyongThu, 12 Ma🤖 cs.AI

Machinagogy: Experiments in Staging Teaching Dramas with LLMs

该论文提出了一种基于黑格尔承认理论与弗洛伊德精神动力学构建的 AI 辅导系统,通过“承认增强提示”与“多代理自我/超我架构”显著提升了教学表现,并采用“氛围学术”(vibe scholarship)的反思性方法论,由 AI 辅助撰写并评估了包含三个模型实验结果的配套论文,以此探讨人机协作对师生及研究者关系的深层影响。

Liam MageeThu, 12 Ma💻 cs

Efficiency vs Demand in AI Electricity: Implications for Post-AGI Scaling

该研究通过将人工智能计算部门纳入全球变化分析模型(GCAM),揭示了在迈向后通用人工智能时代的过程中,AI 电力需求并非线性增长,而是取决于效率提升轨迹与收入驱动需求的博弈,且价格机制调节作用有限,从而为评估 AI 扩张对电力系统和碳排放的长期影响提供了情景分析框架。

Doyi Kim, Jiseok Ahn, Haewon McJeon, Changick KimThu, 12 Ma💻 cs

Technological Excellence Requires Human and Social Context

该论文主张,面对生成式与代理式人工智能的兴起,技术卓越必须超越单纯的性能指标,将伦理、社会与文化维度深度融合于研究设计、未来展望、跨学科教育、沟通传播及制度框架之中,以实现技术严谨性与社会责任的统一。

Karl Palmås, Mats Benner, Monica Billger, Ben Clarke, Raimund Feifel, Julia Fernandez-Rodriguez, Anna Foka, Juliette Griffié, Claes Gustafsson, Kerstin Hamilton, Johan Holmén, Kristina Lindström, Tobias Olofsson, Joana B. Pereira, Marisa Ponti, Julia Ravanis, Sviatlana Shashkova, Emma Sparr, Pontus Strimling, Fredrik Höök, Giovanni VolpeThu, 12 Ma🔬 physics

WalkGPT: Grounded Vision-Language Conversation with Depth-Aware Segmentation for Pedestrian Navigation

本文提出了 WalkGPT,一种将语言推理与分割统一于单一架构中的像素级大视觉语言模型,旨在通过多尺度查询投影和校准文本投影实现深度感知的无障碍导航指导,并发布了包含 4.1 万张图像的大规模基准数据集 PAVE 以验证其在地面导航任务中的有效性。

Rafi Ibn Sultan, Hui Zhu, Xiangyu Zhou, Chengyin Li, Prashant Khanduri, Marco Brocanelli, Dongxiao ZhuThu, 12 Ma💻 cs

Report for NSF Workshop on Algorithm-Hardware Co-design for Medical Applications

本报告总结了 2024 年 9 月在匹兹堡举行的 NSF 医疗应用算法 - 硬件协同设计研讨会,该会议汇聚跨学科专家探讨了四大核心主题,并呼吁通过持续投资共享基础设施、开发临床工作流感知系统及建立可扩展验证生态等战略举措,推动下一代医疗技术的根本性变革与安全转化。

Peipei Zhou, Zheng Dong, Insup Lee, Aidong Zhang, Robert Dick, Majid Sarrafzadeh, Xiaodong Wu, Weisong Shi, Zhuoping Yang, Jingtong Hu, Yiyu ShiThu, 12 Ma💻 cs

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

该论文基于对 16 位从业者的访谈,揭示了前沿人工智能系统(如快速迭代、基准漂移等特性)对人类提升研究(RCT)中因果推断假设构成的独特挑战,并系统梳理了应对这些方法论难题的实用方案,以明确此类证据在高 stakes 决策中的适用边界。

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella GuestThu, 12 Ma🤖 cs.AI