Exploring the Reasoning Depth of Small Language Models in Software Architecture: A Multidimensional Evaluation Framework Towards Software Engineering 2.0

该研究针对“软件工程 2.0"背景下资源受限的小语言模型(SLM),通过构建多维评估框架,揭示了其在生成架构决策记录时的推理深度差异,发现 30 亿参数以上模型具备较强的零样本能力,而小参数模型虽经微调可提升语义多样性,但往往伴随幻觉风险,且少样本提示对特定中等规模模型具有显著的校准作用。

Ha Vo, Nhut Tran, Khang Vo, Phat T. Tran-Truong, Son Ha2026-03-10💻 cs

Towards Scalable Probabilistic Human Motion Prediction with Gaussian Processes for Safe Human-Robot Collaboration

本文提出了一种基于结构化多任务变分高斯过程的框架,利用 6D 旋转表示和联合维度因子化技术,在显著降低参数量的同时实现了可扩展的全身人体运动预测,不仅具备与深度学习模型相当的精度,更提供了可靠且可解释的不确定性估计,从而有效保障了人机协作的安全性。

Jinger Chong, Xiaotong Zhang, Kamal Youcef-Toumi2026-03-10💻 cs

NuNext: Reframing Nucleus Detection as Next-Point Detection

该论文提出了一种名为 NuNext 的新方法,通过将细胞核检测重构为基于多模态大语言模型的“下一点预测”任务,并采用包含空间感知软监督、视觉思维链策略及强化学习微调的两阶段训练框架,在无需复杂后处理的情况下显著提升了组织病理学图像中细胞核检测的精度。

Zhongyi Shui, Honglin Li, Xiaozhong Ji, Ye Zhang, Zijiang Yang, Chenglu Zhu, Yuxuan Sun, Kai Yao, Conghui He, Cheng Tan2026-03-10💻 cs

Grounding Machine Creativity in Game Design Knowledge Representations: Empirical Probing of LLM-Based Executable Synthesis of Goal Playable Patterns under Structural Constraints

该研究通过对比直接生成与基于人类作者定义的中间表示(IR)的流水线方法,实证评估了大型语言模型在结构约束下将目标可玩模式(GPCs)转化为可编译 Unity 游戏代码的能力,并揭示了当前模型在代码生成中面临的主要结构性“接地”与“卫生”失败模式。

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10💻 cs

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

该论文提出了一种结合半自回归生成与在线知识蒸馏的个性化重排序框架(PSAD),通过引入用户画像网络增强用户 - 物品交互,有效解决了生成式重排序中生成质量与推理延迟的平衡难题,并在多个数据集上显著优于现有最先进方法。

Kai Cheng, Hao Wang, Wei Guo, Weiwen Liu, Yong Liu, Yawen Li, Enhong Chen2026-03-10💻 cs

Vision Language Models Cannot Reason About Physical Transformation

该论文通过构建 ConservationBench 基准测试发现,当前视觉语言模型在面对物理变换时无法真正理解守恒定律,其表现接近随机猜测且受文本先验误导,表明它们缺乏在动态场景中保持物理属性变换不变性的推理能力。

Dezhi Luo, Yijiang Li, Maijunxian Wang, Tianwei Zhao, Bingyang Wang, Siheng Wang, Pinyuan Feng, Pooyan Rahmanzadehgervi, Ziqiao Ma, Hokin Deng2026-03-10💻 cs

Inter-Image Pixel Shuffling for Multi-focus Image Fusion

该论文提出了一种名为“图像间像素混洗(IPS)”的新方法,通过将多聚焦图像融合重构为像素级分类任务,利用单张清晰图像及其低通滤波版本生成无需真实多聚焦数据的合成训练集,并结合卷积神经网络与状态空间模型构建的跨图像融合网络,实现了在缺乏真实多聚焦训练数据的情况下仍能显著超越现有方法的高质量融合效果。

Huangxing Lin, Rongrong Ma, Cheng Wang2026-03-10💻 cs

Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge

本文提出了 EyExIn 框架,通过专家感知双流编码、语义自适应门控融合及自适应深度专家注入机制,有效解决了视网膜视觉语言模型在细粒度病理感知和推理过程中因语言先验主导而产生的幻觉问题,显著提升了眼科视觉问答的精度与可信度。

Shuai Lu, Meng Wang, Jia Guo, Jiawei Du, Bo Liu, Shengzhu Yang, Weihang Zhang, Huazhu Fu, Huiqi Li2026-03-10💻 cs