Skeleton-to-Image Encoding: Enabling Skeleton Representation Learning via Vision-Pretrained Models

该论文提出了一种名为“骨骼到图像编码”(S2I)的新方法,通过将骨骼序列转换为类图像格式,成功利用大规模预训练视觉模型进行自监督骨骼表征学习,有效解决了骨骼数据格式差异大及多模态动作识别中引入额外分支的难题,并在多个基准数据集上验证了其优越的泛化能力。

Siyuan Yang, Jun Liu, Hao Cheng, Chong Wang, Shijian Lu, Hedvig Kjellstrom, Weisi Lin, Alex C. Kot2026-03-09🤖 cs.AI

MASFactory: A Graph-centric Framework for Orchestrating LLM-Based Multi-Agent Systems with Vibe Graphing

本文提出了 MASFactory,这是一个以图为核心的 LLM 多智能体系统编排框架,通过引入将自然语言意图转化为可编辑工作流的“氛围图(Vibe Graphing)”人机协同方法,解决了复杂图工作流实现困难、复用性低及外部上下文集成复杂的问题,并在多个基准测试中验证了其有效性与一致性。

Yang Liu, Jinxuan Cai, Yishen Li, Qi Meng, Zedi Liu, Xin Li, Chen Qian, Chuan Shi, Cheng Yang2026-03-09🤖 cs.AI

Probing Visual Concepts in Lightweight Vision-Language Models for Automated Driving

该论文通过构建反事实图像集并训练线性探针,分析了轻量级视觉语言模型在自动驾驶场景中对视觉概念的编码机制,揭示了感知失败(概念未线性编码)与认知失败(概念存在但语义对齐错误)两种主要故障模式,并发现物体距离增加会显著降低视觉概念的可分性。

Nikos Theodoridis, Reenu Mohandas, Ganesh Sistu, Anthony Scanlan, Ciarán Eising, Tim Brophy2026-03-09🤖 cs.AI

Agentic LLM Planning via Step-Wise PDDL Simulation: An Empirical Characterisation

该论文通过引入 PyPDDLEngine 引擎,将大语言模型(LLM)转化为基于 PDDL 模拟的交互式分步规划代理,实证表明尽管其规划成功率仅比直接 LLM 规划略高且成本显著增加,但在特定难度下能生成更短路径,然而其性能提升受限于缺乏类似代码编译错误等外部验证信号,导致代理难以有效评估自身进展。

Kai Göbel, Pierrick Lorang, Patrik Zips, Tobias Glück2026-03-09🤖 cs.AI

Experiences Build Characters: The Linguistic Origins and Functional Impact of LLM Personality

该研究通过无监督领域预训练模拟大语言模型的经验积累,利用机器人格量表量化其性格特征,发现“表达型通才”与“抑制型专才”表现最佳,且社会性特质受抑反而能提升复杂推理能力,从而揭示了训练数据语言特征对模型性格及性能的因果影响,为“人格工程”提供了新路径。

Xi Wang, Mengdie Zhuang, Jiqun Liu2026-03-09🤖 cs.AI