A Two-Stage Multitask Vision-Language Framework for Explainable Crop Disease Visual Question Answering

该论文提出了一种基于 Swin Transformer 和序列到序列解码器的轻量级两阶段多任务视觉语言框架,通过先训练后冻结视觉编码器的策略,在作物病害视觉问答任务中实现了接近完美的分类精度、优异的语言生成能力及良好的可解释性,并在外部基准测试中展现了出色的泛化性能。

Md. Zahid Hossain, Most. Sharmin Sultana Samu, Md. Rakibul Islam, Md. Siam AnsaryTue, 10 Ma💬 cs.CL

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

该论文提出了名为 MAS-Orchestra 的训练框架,通过将多智能体编排建模为函数调用强化学习问题来实现全局系统推理,并引入 MASBENCH 基准从五个维度严格评估任务特性,从而揭示了多智能体系统的收益取决于任务结构而非普遍适用,最终在数学推理等任务中实现了显著的性能提升与效率优化。

Zixuan Ke, Yifei Ming, Austin Xu, Ryan Chin, Xuan-Phi Nguyen, Prathyusha Jwalapuram, Jiayu Wang, Semih Yavuz, Caiming Xiong, Shafiq JotyTue, 10 Ma💬 cs.CL

Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

该研究利用自然语言处理技术从需求文本中提取结构网络,并通过分子集成任务作为结构同构代理进行受控实验,证实了基于谱的度量指标(相关系数超过 0.95)能有效预测集成工作量,从而填补了架构复杂度分析与需求工程实践之间的关键方法学空白。

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh BabuTue, 10 Ma💬 cs.CL

Neuro-Symbolic Synergy for Interactive World Modeling

该论文提出了 Neuro-Symbolic Synergy (NeSyS) 框架,通过交替训练将大语言模型的语义先验与可执行的符号规则相结合,利用符号模型直接约束输出分布并仅针对未覆盖轨迹微调神经模型,从而在 ScienceWorld、Webshop 和 Plancraft 等交互式环境中显著提升了世界模型的预测准确性、鲁棒性及数据效率。

Hongyu Zhao, Siyu Zhou, Haolin Yang, Zengyi Qin, Tianyi ZhouTue, 10 Ma💬 cs.CL

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

CogitoRAG 是一种受人类情景记忆启发的检索增强生成框架,通过构建多维知识图谱、提取语义主旨、执行实体扩散检索及引入 CogniRank 重排序算法,有效解决了传统方法中的语义完整性丢失问题,在复杂知识整合与推理任务中显著优于现有方法。

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun YuTue, 10 Ma💬 cs.CL