cs.AI 篇论文 | Gist.Science

Subclass Classification of Gliomas Using MRI Fusion Technique

该研究提出了一种基于多模态 MRI 图像融合（T1、T2、T1ce 和 FLAIR）的胶质瘤亚类分类方法，通过结合 2D 与 3D UNET 分割及加权平均融合技术，并利用预训练 ResNet50 模型进行分类，在 BraTS 数据集上实现了 99.25% 的高准确率，显著优于现有方法。

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

该研究提出了一种基于 U-Net、Inception 和 ResNet 架构的深度学习混合模型，旨在平衡 2D 与 3D 卷积在计算效率与空间精度间的权衡，通过在 BraTS 数据集上的实验验证，该模型在 3D 和 2D 胶质瘤分割任务中分别实现了 98.91% 和 99.77% 的高准确率，为临床脑肿瘤自动诊断提供了有效解决方案。

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning

该论文提出了一种名为“留一法 PPO"（LOOP）的新型强化学习方法，通过结合 REINFORCE 的方差缩减技术与 PPO 的鲁棒性及样本效率优势，有效解决了文本到图像扩散模型微调中样本效率与最终性能之间的权衡难题。

Shashank Gupta, Chaitanya Ahuja, Tsung-Yu Lin + 4 more2026-03-10🤖 cs.AI

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

本文针对现有基于大语言模型的多智能体系统在动态环境（如 Minecraft）中因串行执行导致的响应延迟问题，提出了一种具备可中断执行能力的双线程并行规划 - 行动框架，通过中央记忆系统同步规划线程与技能库驱动的递归执行线程，显著提升了系统的实时响应与适应能力。

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

LLM-Powered Prediction of Hyperglycemia and Discovery of Behavioral Treatment Pathways from Wearables and Diet

该研究提出了一种名为 GlucoLens 的可解释机器学习系统，它利用可穿戴设备、饮食及工作日志等多模态数据，结合大语言模型来预测餐后血糖曲线下面积及高血糖风险，并能通过反事实解释为个体提供个性化的行为干预建议。

Abdullah Mamun, Asiful Arefeen, Susan B. Racette + 4 more2026-03-10🤖 cs.AI

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

该研究提出了一种结合解剖学标志点与 Transformer 架构的新型图卷积神经网络，利用四面体网格处理 sMRI 数据，在无需昂贵 PET 扫描的情况下显著提升了阿尔茨海默病诊断及脑淀粉样蛋白阳性（尤其是中风险人群）的预测精度。

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

The impact of AI and peer feedback on research writing skills: a study using the CGScholar platform among Kazakhstani scholars

该研究利用 CGScholar 平台对 36 名哈萨克斯坦学者进行调查，发现人工智能工具的熟悉度与接受反馈的意愿呈中等正相关，而研究写作经验则与对同行反馈（尤其是方法论方面）的期望呈强正相关，表明将 AI 辅助与传统同行反馈相结合能有效提升学术写作质量。

Raigul Zheldibayeva2026-03-10🤖 cs.AI

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

本文提出了 ViLAM 方法，通过将大型视觉 - 语言模型的推理能力蒸馏为空间注意力图，从而生成具备社会意识的导航代价地图，显著提升了机器人在真实场景中的社会合规导航成功率。

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

IMPACT: Intelligent Motion Planning with Acceptable Contact Trajectories via Vision-Language Models

本文提出了 IMPACT 框架，利用视觉语言模型推断环境语义以生成各向异性接触成本图，并结合接触感知 A*规划器，实现在杂乱环境中高效且安全的接触式运动规划。

Yiyang Ling, Karan Owalekar, Oluwatobiloba Adesanya, Erdem Bıyık, Daniel Seita2026-03-10🤖 cs.LG

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

本文介绍了 iProg 工具，它通过结合大语言模型与人类反馈的交互式结构化归纳编程方法，将科学数据分析任务分解为数据流图并生成代码，从而在开发速度、代码质量和系统性能上显著优于传统的低代码/无代码方案。

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

More Women, Same Stereotypes: Unpacking the Gender Bias Paradox in Large Language Models

该研究通过自由叙事评估框架发现，尽管大型语言模型因微调技术导致女性角色在职业分布上被过度代表，但其生成的职业性别比例仍比现实数据更贴近人类刻板印象，揭示了当前缓解性别偏见措施面临的悖论与挑战。

Evan Chen, Run-Jun Zhan, Yan-Bai Lin, Hung-Hsuan Chen2026-03-10💬 cs.CL

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

该论文提出了一种从 2D 对齐到 3D 合理性的统一框架，通过融合异构基础模型先验进行 2D 结构对齐，并引入无穿透扩散模型优化 3D 空间交互，从而在单目图像中实现抗遮挡、无穿透且符合物理真实性的双手重建。

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

More Bang for the Buck: Process Reward Modeling with Entropy-Driven Uncertainty

本文提出了熵驱动不确定性过程奖励模型（EDU-PRM），该框架通过利用高预测熵自动锚定推理步骤边界，无需昂贵的人工标注即可在 ProcessBench 基准测试中超越现有强基线，并仅用 1.5% 的训练数据实现了与 SOTA 模型相当的性能及更高效的推理。

Lang Cao, Renhong Chen, Yingtian Zou, Chao Peng, Huacong Xu, Yuxian Wang, Wu Ning, Qian Chen, Mofan Peng, Zijie Chen, Peishuo Su, Yitong Li2026-03-10🤖 cs.LG

MediTools -- Medical Education Powered by LLMs

该研究介绍了名为 MediTools 的基于大语言模型的医疗教育原型应用，通过提供皮肤科病例模拟、AI 增强版 PubMed 文献分析及医疗新闻摘要等工具，旨在革新医学教育并提升临床决策能力，同时通过针对医疗从业者的调查验证了其初步效果。

Amr Alshatnawi, Remi Sampaleanu, David Liebovitz2026-03-10💻 cs

Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals

本文提出了一种名为 MetaBoost 的混合框架，通过集成多种数据平衡技术与反事实分析，不仅显著提升了代谢综合征预测模型的准确性，还识别出血糖和甘油三酯为关键风险因素，为临床干预提供了可操作的见解。

Sanyam Paresh Shah, Abdullah Mamun, Shovito Barua Soumma + 1 more2026-03-10🤖 cs.AI

From LLM Reasoning to Autonomous AI Agents: A Comprehensive Review

该论文系统整合了2019至2025年间评估大语言模型与自主智能体的碎片化工作，提出了涵盖约60个基准的统一分类法，综述了智能体框架、跨领域应用及关键协作协议，并针对未来研究方向提出了具体建议。

Mohamed Amine Ferrag, Norbert Tihanyi, Merouane Debbah2026-03-10🤖 cs.LG

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

本文提出了一种名为 SFIBA 的空间全目标不可见后门攻击方法，通过结合频域注入、形态约束及局部空间区域限制，在确保触发器视觉不可见性和针对所有类别的特定性的同时，实现了高效的黑盒多目标攻击并有效规避现有防御。

Yangxu Yin, Honglong Chen, Yudong Gao, Peng Sun, Zhishuai Li, Weifeng Liu2026-03-10💻 cs

Multi-Domain Audio Question Answering Benchmark Toward Acoustic Content Reasoning

本文介绍了 DCASE 2025 挑战赛中的第五项任务，即一个涵盖生物声学、时间声景和复杂问答等多领域的音频问答基准，旨在通过多样化的数据集和评估协议推动音频语言模型在声学内容推理方面的发展，使其具备接近人类水平的感知与交互能力。

Chao-Han Huck Yang, Sreyan Ghosh, Qing Wang, Jaeyeon Kim, Hengyi Hong, Sonal Kumar, Guirui Zhong, Zhifeng Kong, S Sakshi, Vaibhavi Lokegaonkar, Oriol Nieto, Ramani Duraiswami, Dinesh Manocha, Gunhee Kim, Jun Du, Rafael Valle, Bryan Catanzaro2026-03-10💬 cs.CL

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

该研究通过引入认知负荷理论，分析了 34 位金融专业人士在利用 GPT-4o 完成复杂估值任务时的表现，发现 AI 生成内容能提升工作质量，但由模型发起的任务切换等引发的外在认知负荷对绩效的负面影响最大，且这种负面影响会随经验不足而加剧。

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew Beane2026-03-10💻 cs

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

该论文提出了名为 Ready2Unlearn 的元学习优化方法，通过在训练阶段前瞻性地赋予模型“可遗忘就绪”状态，使其在面对未来的数据删除请求时，能够比传统反应式方法更高效、更规范地执行机器遗忘。

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG