cs.AI 篇论文 | Gist.Science

Quantifying Information Loss under Coarse-Grained Partitions: A Discrete Framework for Explainable Artificial Intelligence

本文提出了一种基于粗粒度划分（CGPs）的离散框架，通过引入范畴统一（CU）和基于 KL 散度的信息损失度量 $D_{\mathrm{KL\text{-}CU}}$ ，为可解释人工智能中准确性与可解释性之间的权衡提供了数学形式化分析，并揭示了零信息损失在常规评估实践中是极罕见的极限情况。

Takashi Izumo2026-03-10🤖 cs.AI

Language in the Flow of Time: Time-Series-Paired Texts Weaved into a Unified Temporal Narrative

该论文提出了名为“文本即时间序列”（TaTS）的新框架，通过将具有周期性特征的配对文本视为时间序列的辅助变量，使现有纯数值时间序列模型无需修改架构即可有效处理多模态数据，从而显著提升预测和插补任务的性能。

Zihao Li, Xiao Lin, Zhining Liu, Jiaru Zou, Ziwei Wu, Lecheng Zheng, Dongqi Fu, Yada Zhu, Hendrik Hamann, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

LaVCa: LLM-assisted Visual Cortex Captioning

该论文提出了一种名为 LaVCa 的数据驱动方法，利用大语言模型为图像生成自然语言描述，从而比现有方法更准确、细致地解析人脑视觉皮层中体素的选择性及其功能特性。

Takuya Matsuyama, Shinji Nishimoto, Yu Takagi2026-03-10🤖 cs.LG

Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective

该论文提出了一种基于难度聚类的 COD 框架，通过构建具有稳定扩展特性的任务子集并推导映射函数，成功解决了大语言模型下游任务性能预测中因能力涌现和任务难度不均导致的高变异性问题，在 70B 参数模型上实现了仅 1.55% 的平均预测误差。

Chengyin Xu, Kaiyuan Chen, Xiao Li, Ke Shen, Chenggang Li2026-03-10🤖 cs.LG

Subclass Classification of Gliomas Using MRI Fusion Technique

该研究提出了一种基于多模态 MRI 图像融合（T1、T2、T1ce 和 FLAIR）的胶质瘤亚类分类方法，通过结合 2D 与 3D UNET 分割及加权平均融合技术，并利用预训练 ResNet50 模型进行分类，在 BraTS 数据集上实现了 99.25% 的高准确率，显著优于现有方法。

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

该研究提出了一种基于 U-Net、Inception 和 ResNet 架构的深度学习混合模型，旨在平衡 2D 与 3D 卷积在计算效率与空间精度间的权衡，通过在 BraTS 数据集上的实验验证，该模型在 3D 和 2D 胶质瘤分割任务中分别实现了 98.91% 和 99.77% 的高准确率，为临床脑肿瘤自动诊断提供了有效解决方案。

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

该论文提出了一种名为“留一法 PPO"（LOOP）的新型强化学习方法，通过结合 REINFORCE 的方差缩减技术与 PPO 的鲁棒性及样本效率优势，有效解决了文本到图像扩散模型微调中样本效率与最终性能之间的权衡难题。

Shashank Gupta, Chaitanya Ahuja, Tsung-Yu Lin + 4 more2026-03-10🤖 cs.AI

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

本文针对现有基于大语言模型的多智能体系统在动态环境（如 Minecraft）中因串行执行导致的响应延迟问题，提出了一种具备可中断执行能力的双线程并行规划 - 行动框架，通过中央记忆系统同步规划线程与技能库驱动的递归执行线程，显著提升了系统的实时响应与适应能力。

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

该研究提出了一种名为 GlucoLens 的可解释机器学习系统，它利用可穿戴设备、饮食及工作日志等多模态数据，结合大语言模型来预测餐后血糖曲线下面积及高血糖风险，并能通过反事实解释为个体提供个性化的行为干预建议。

Abdullah Mamun, Asiful Arefeen, Susan B. Racette + 4 more2026-03-10🤖 cs.AI

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

该研究提出了一种结合解剖学标志点与 Transformer 架构的新型图卷积神经网络，利用四面体网格处理 sMRI 数据，在无需昂贵 PET 扫描的情况下显著提升了阿尔茨海默病诊断及脑淀粉样蛋白阳性（尤其是中风险人群）的预测精度。

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

The impact of AI and peer feedback on research writing skills: a study using the CGScholar platform among Kazakhstani scholars

该研究利用 CGScholar 平台对 36 名哈萨克斯坦学者进行调查，发现人工智能工具的熟悉度与接受反馈的意愿呈中等正相关，而研究写作经验则与对同行反馈（尤其是方法论方面）的期望呈强正相关，表明将 AI 辅助与传统同行反馈相结合能有效提升学术写作质量。

Raigul Zheldibayeva2026-03-10🤖 cs.AI

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

本文提出了 ViLAM 方法，通过将大型视觉 - 语言模型的推理能力蒸馏为空间注意力图，从而生成具备社会意识的导航代价地图，显著提升了机器人在真实场景中的社会合规导航成功率。

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

IMPACT: Intelligent Motion Planning with Acceptable Contact Trajectories via Vision-Language Models

本文提出了 IMPACT 框架，利用视觉语言模型推断环境语义以生成各向异性接触成本图，并结合接触感知 A*规划器，实现在杂乱环境中高效且安全的接触式运动规划。

Yiyang Ling, Karan Owalekar, Oluwatobiloba Adesanya, Erdem Bıyık, Daniel Seita2026-03-10🤖 cs.LG

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

本文介绍了 iProg 工具，它通过结合大语言模型与人类反馈的交互式结构化归纳编程方法，将科学数据分析任务分解为数据流图并生成代码，从而在开发速度、代码质量和系统性能上显著优于传统的低代码/无代码方案。

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models

该研究通过自由叙事评估框架发现，尽管大型语言模型因微调技术导致女性角色在职业分布上被过度代表，但其生成的职业性别比例仍比现实数据更贴近人类刻板印象，揭示了当前缓解性别偏见措施面临的悖论与挑战。

Evan Chen, Run-Jun Zhan, Yan-Bai Lin, Hung-Hsuan Chen2026-03-10💬 cs.CL

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

该论文提出了一种从 2D 对齐到 3D 合理性的统一框架，通过融合异构基础模型先验进行 2D 结构对齐，并引入无穿透扩散模型优化 3D 空间交互，从而在单目图像中实现抗遮挡、无穿透且符合物理真实性的双手重建。

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

cs.AI