Reasoning Models Struggle to Control their Chains of Thought

该论文通过引入 CoT-Control 评估套件发现,尽管推理模型在控制最终输出方面表现较强,但其控制思维链(CoT)内容的能力显著较弱,且随着模型规模增大、强化学习训练、测试时计算增加或问题难度提升而进一步降低,这表明目前 CoT 监控机制不太可能因模型主动操控思维链而失效。

Chen Yueh-Han, Robert McCarthy, Bruce W. Lee, He He, Ian Kivlichan, Bowen Baker, Micah Carroll, Tomek Korbak2026-03-09🤖 cs.AI

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

该论文指出,人工智能在地球系统科学中的快速应用若缺乏干预,将因算力与数据基础设施的全球南北差异而加剧气候信息领域的不平等,因此呼吁通过转向以数据为中心的开发模式、建立气候数字公共基础设施以及推动知识共同生产,来确保 AI 革命真正促进全球系统韧性而非加剧不公。

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

该论文通过一项涵盖全球多地区的大规模调查,从不同社群中提炼出文化的操作性定义,以评估人们对生成式 AI 如何呈现文化 artifacts、概念及价值观的看法与期望,并最终提出了包括参与式方法、超越地理维度的文化考量以及文化“红线”敏感性框架在内的开发建议。

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

该论文提出了“解耦安全假设”(DSH),通过几何分析揭示大语言模型中“识别有害性”与“执行拒绝”机制在深层解耦的现象,并据此开发了能实现“只知不行”状态的双差分提取与自适应因果引导方法,进而提出了具有 SOTA 攻击成功率的“拒绝擦除攻击”(REA)。

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

该论文提出了 PVminer 基准及经过监督微调的大语言模型 PVminerLLM,旨在从患者生成的文本中高效提取结构化患者声音信息,实验表明该方法在多种任务上显著优于提示基线,且无需超大模型规模即可实现可扩展的社会与体验信号分析。

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

该研究通过在 POPROX 平台上对 120 名美国用户进行为期 5 周的实地实验,验证了结合“主题 - 地域双重校准”算法与基于大语言模型的个性化呈现“助推”策略能有效提升新闻推荐的多样性,并促使读者逐渐养成兼顾国内与国际新闻的阅读习惯。

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. Konstan2026-03-09🤖 cs.AI

Ambiguity Collapse by LLMs: A Taxonomy of Epistemic Risks

本文提出了“歧义坍缩”概念,即大语言模型在处理具有多重合法解释的模糊术语时将其强行简化为单一结论,从而绕过人类意义协商过程,并据此构建了一个涵盖过程、输出和生态系统三个层面的认识论风险分类体系,旨在通过多层面的缓解原则设计能够保留并负责任地治理歧义的系统。

Shira Gur-Arieh, Angelina Wang, Sina Fazelpour2026-03-09🤖 cs.AI

Remote Sensing Image Classification Using Deep Ensemble Learning

该论文提出了一种结合卷积神经网络(CNN)与视觉 Transformer(ViT)的集成学习融合模型,通过训练四个独立模型并在预测阶段进行集成,有效克服了单一架构的局限性及冗余特征瓶颈,在 UC Merced、RSSCN7 和 MSRSI 等遥感图像数据集上取得了优于现有方法的分类精度。

Niful Islam, Md. Rayhan Ahmed, Nur Mohammad Fahad, Salekul Islam, A. K. M. Muzahidul Islam, Saddam Mukta, Swakkhar Shatabda2026-03-09🤖 cs.AI