The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

该论文通过算法审计揭示,《数字服务法》因对“广告”定义过窄,导致 TikTok 虽在形式上遵守禁止向未成年人投放基于画像广告的规定,却未能有效规制未标注的网红营销等实质商业内容,致使未成年人仍遭受严重的个性化商业诱导,因此呼吁扩大监管定义以填补这一漏洞。

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan Srba2026-03-09🤖 cs.AI

SecureRAG-RTL: A Retrieval-Augmented, Multi-Agent, Zero-Shot LLM-Driven Framework for Hardware Vulnerability Detection

本文提出了 SecureRAG-RTL 框架,通过结合检索增强生成(RAG)与多智能体零样本技术,显著提升了大语言模型在缺乏公开数据集情况下的硬件描述语言(HDL)漏洞检测能力,并发布了包含真实漏洞的基准数据集以推动相关研究。

Touseef Hasan, Blessing Airehenbuwa, Nitin Pundir, Souvika Sarkar, Ujjwal Guin2026-03-09🤖 cs.AI

Reasoning Models Struggle to Control their Chains of Thought

该论文通过引入 CoT-Control 评估套件发现,尽管推理模型在控制最终输出方面表现较强,但其控制思维链(CoT)内容的能力显著较弱,且随着模型规模增大、强化学习训练、测试时计算增加或问题难度提升而进一步降低,这表明目前 CoT 监控机制不太可能因模型主动操控思维链而失效。

Chen Yueh-Han, Robert McCarthy, Bruce W. Lee, He He, Ian Kivlichan, Bowen Baker, Micah Carroll, Tomek Korbak2026-03-09🤖 cs.AI

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

该论文指出,人工智能在地球系统科学中的快速应用若缺乏干预,将因算力与数据基础设施的全球南北差异而加剧气候信息领域的不平等,因此呼吁通过转向以数据为中心的开发模式、建立气候数字公共基础设施以及推动知识共同生产,来确保 AI 革命真正促进全球系统韧性而非加剧不公。

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

该论文通过一项涵盖全球多地区的大规模调查,从不同社群中提炼出文化的操作性定义,以评估人们对生成式 AI 如何呈现文化 artifacts、概念及价值观的看法与期望,并最终提出了包括参与式方法、超越地理维度的文化考量以及文化“红线”敏感性框架在内的开发建议。

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models

该论文提出了“解耦安全假设”(DSH),通过几何分析揭示大语言模型中“识别有害性”与“执行拒绝”机制在深层解耦的现象,并据此开发了能实现“只知不行”状态的双差分提取与自适应因果引导方法,进而提出了具有 SOTA 攻击成功率的“拒绝擦除攻击”(REA)。

Jinman Wu, Yi Xie, Shen Lin, Shiqian Zhao, Xiaofeng Chen2026-03-09🤖 cs.AI

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

该论文提出了 PVminer 基准及经过监督微调的大语言模型 PVminerLLM,旨在从患者生成的文本中高效提取结构化患者声音信息,实验表明该方法在多种任务上显著优于提示基线,且无需超大模型规模即可实现可扩展的社会与体验信号分析。

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

该研究通过在 POPROX 平台上对 120 名美国用户进行为期 5 周的实地实验,验证了结合“主题 - 地域双重校准”算法与基于大语言模型的个性化呈现“助推”策略能有效提升新闻推荐的多样性,并促使读者逐渐养成兼顾国内与国际新闻的阅读习惯。

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. Konstan2026-03-09🤖 cs.AI