PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

该论文提出了包含 4.1 万份真实报告的 PET-F2I-41K 基准数据集及三种临床评估指标,并通过 LoRA 微调构建了 PET-F2I-7B 模型,显著提升了 PET/CT 影像报告印象生成的准确性与事实一致性,为临床部署提供了高效可靠的解决方案。

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

Layer Consistency Matters: Elegant Latent Transition Discrepancy for Generalizable Synthetic Image Detection

该论文提出了一种名为“潜在过渡差异(LTD)”的新方法,通过捕捉真实图像与合成图像在网络层间特征过渡一致性的差异,有效解决了现有合成图像检测技术泛化能力不足的问题,并在多个数据集上实现了优于当前最先进方法的检测精度与鲁棒性。

Yawen Yang, Feng Li, Shuqi Kong, Yunfeng Diao, Xinjian Gao, Zenglin Shi, Meng Wang2026-03-12💻 cs

How To Embed Matters: Evaluation of EO Embedding Design Choices

该论文利用 NeuCo-Bench 对地球观测基础模型(GeoFMs)的嵌入设计进行了系统分析,揭示了骨干架构、预训练策略及聚合方式等关键选择对下游任务性能的影响,并证明了通过特定设计可将原始数据压缩为 500 倍以上的紧凑嵌入,同时保持广泛的下游任务适用性。

Luis Gilch, Isabelle Wittmann, Maximilian Nitsche, Johannes Jakubik, Arne Ewald, Thomas Brunschwiler2026-03-12💻 cs

WalkGPT: Grounded Vision-Language Conversation with Depth-Aware Segmentation for Pedestrian Navigation

本文提出了 WalkGPT,一种将语言推理与分割统一于单一架构中的像素级大视觉语言模型,旨在通过多尺度查询投影和校准文本投影实现深度感知的无障碍导航指导,并发布了包含 4.1 万张图像的大规模基准数据集 PAVE 以验证其在地面导航任务中的有效性。

Rafi Ibn Sultan, Hui Zhu, Xiangyu Zhou, Chengyin Li, Prashant Khanduri, Marco Brocanelli, Dongxiao Zhu2026-03-12💻 cs