Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

该论文提出了一种利用 Gemma 3 和 Qwen3-VL 等视觉语言基础模型,通过上下文学习从无人机遥感图像中直接生成植物仿真配置(JSON 格式)的新方法,旨在解决功能性结构植物模型在规模化部署中的复杂性瓶颈,并构建了首个针对农业数字孪生三维重建的评估基准。

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

本文提出了 PathoScribe 框架,通过统一的检索增强大语言模型技术,将静态的病理报告档案转化为支持自然语言检索、自动队列构建及临床推理的“活体图书馆”,显著提升了病理数据的检索效率与临床决策价值。

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

本文针对当前智能代理受限于传统操作系统架构而导致的交互碎片化与权限管理混乱问题,提出了一种以自然语言为核心、将操作系统重构为实时意图挖掘与知识发现引擎的“代理操作系统(AgentOS)”新范式,并指出其本质是一个涉及序列模式挖掘与动态知识图谱构建的知识发现与数据挖掘(KDD)问题。

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian PeiWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

本文提出了一种名为 CMA-ES-IG 的算法,通过将用户感知体验纳入偏好学习过程,利用感知差异显著且信息量丰富的轨迹来优化机器人行为搜索,从而在提高高维空间扩展性、计算效率及抗噪性的同时,显著提升了非专家用户的满意度与系统采用率。

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

该论文提出了 MEMO(记忆增强模型上下文优化)框架,通过结合持久化记忆库与基于 TrueSkill 的不确定性感知提示演化,显著提升了多轮多智能体 LLM 游戏评估中的胜率并降低了运行方差,从而解决了长程交互中因早期偏差累积导致的性能不稳定问题。

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI