HeartAgent: An Autonomous Agent System for Explainable Differential Diagnosis in Cardiology

本文介绍了名为 HeartAgent 的自主智能体系统,该系统通过整合定制化工具与多智能体协作机制,在心血管疾病的鉴别诊断中显著提升了准确率与可解释性,并有效辅助临床医生做出更可靠的决策。

Shuang Zhou, Kai Yu, Song Wang, Wenya Xie, Zaifu Zhan, Meng-Han Tsai, Yuen-Hei Chung, Shutong Hou, Huixue Zhou, Min Zeng, Bhavadharini Ramu, Lin Yee Chen, Feng Xie, Rui Zhang2026-03-12💬 cs.CL

Interpretable Chinese Metaphor Identification via LLM-Assisted MIPVU Rule Script Generation: A Comparative Protocol Study

该论文提出了一种利用大语言模型辅助生成可执行规则脚本的管道,将四种隐喻识别协议(MIP/MIPVU、CMDAG、情感检测及明喻识别)转化为透明且可审计的模块化流程,并在七个中文数据集上首次进行了跨协议比较,揭示了协议选择对识别结果的影响远超模型差异,同时证明了该方法在保持完全透明性的同时具备竞争力。

Weihang Huang, Mengna Liu2026-03-12💬 cs.CL

Multilingual Reasoning Gym: Multilingual Scaling of Procedural Reasoning Environments

本文提出了“多语言推理健身房”(Multilingual Reasoning Gym),这是一个在原有推理健身房基础上的扩展,通过原生母语者验证和针对性适配,在 14 种语言中程序化地生成了 94 类可验证的推理任务,从而支持大规模跨语言数据生成及多语言推理模型的强化学习与评估研究。

Konstantin Dobler, Simon Lehnerer, Federico Scozzafava, Jonathan Janke, Mohamed Ali2026-03-12💬 cs.CL

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

针对数据稀缺的 NPU 内核合成领域,本文提出了名为 EvoKernel 的自进化智能体框架,通过基于价值的记忆检索机制实现从冷启动草稿到持续优化的自动化流程,显著提升了大模型在特定硬件生态中的代码正确率与执行效率。

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

SiDiaC-v.2.0: Sinhala Diachronic Corpus Version 2.0

SiDiaC-v.2.0 是迄今为止规模最大的斯里兰卡语历时语料库,收录了涵盖 1800 至 1955 年出版日期的 185 部文学作品(共 24.4 万词),经过严格的筛选、预处理、版权合规检查及后处理,并借鉴了其他语料库的构建实践,为低资源语言的自然语言处理提供了宝贵的分层分类资源。

Nevidu Jayatilleke, Nisansa de Silva, Uthpala Nimanthi, Gagani Kulathilaka, Azra Safrullah, Johan Sofalas2026-03-12💬 cs.CL

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

本文发布了一个包含英语和德语编目记录及机器可读 GND 本体的大型双语数据集,旨在通过支持本体感知的多标签分类和可复现的评估,推动权威锚定的人工智能在数字图书馆编目中的实际应用。

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

GLM-OCR Technical Report

GLM-OCR 是一款参数量仅为 0.9B 的高效紧凑型多模态模型,通过结合 CogViT 视觉编码器与 GLM 语言解码器,并引入多 token 预测机制及两阶段处理流程,在显著降低计算资源消耗的同时,实现了在文档解析、公式转录、表格结构恢复及关键信息提取等任务中的卓越性能,适用于边缘设备部署与大规模生产系统。

Shuaiqi Duan, Yadong Xue, Weihan Wang, Zhe Su, Huan Liu, Sheng Yang, Guobing Gan, Guo Wang, Zihan Wang, Shengdong Yan, Dexin Jin, Yuxuan Zhang, Guohong Wen, Yanfeng Wang, Yutao Zhang, Xiaohan Zhang, Wenyi Hong, Yukuo Cen, Da Yin, Bin Chen, Wenmeng Yu, Xiaotao Gu, Jie Tang2026-03-12💬 cs.CL