Cognitively Layered Data Synthesis for Domain Adaptation of LLMs to Space Situational Awareness

该论文提出了基于布鲁姆分类学的 BD-FDG 框架,通过结构化知识组织、认知分层问题建模及自动化质量控制,构建了包含 23 万样本的 SSA-SFT 数据集并微调出 SSA-LLM-8B 模型,显著提升了大语言模型在空间态势感知领域的专业表现,同时保持了通用能力。

Ding Linghu, Cheng Wang, Da Fan, Wei Shi, Kaifeng Yin, Xiaoliang Xue, Fan Yang, Haiyi Ren, Cong Zhang2026-03-11🤖 cs.AI

Multi-model approach for autonomous driving: A comprehensive study on traffic sign-, vehicle- and lane detection and behavioral cloning

该研究提出了一种结合预训练与定制神经网络的单模型方法,通过数据增强、图像归一化和迁移学习等技术,利用 GTSRB 及 Udacity 模拟器等多源数据集,系统性地实现了交通标志识别、车辆与车道检测及行为克隆,从而提升了自动驾驶系统的感知能力与决策可靠性。

Kanishkha Jaisankar, Pranav M. Pawar, Diana Susane Joseph, Raja Muthalagu, Mithun Mukherjee2026-03-11🤖 cs.AI

SpaceSense-Bench: A Large-Scale Multi-Modal Benchmark for Spacecraft Perception and Pose Estimation

本文提出了名为 SpaceSense-Bench 的大规模多模态基准数据集,该数据集基于虚幻引擎 5 生成,包含 136 种卫星模型的高保真同步 RGB、深度及 LiDAR 数据与精细标注,旨在解决航天器感知与位姿估计中真实数据匮乏的问题,并通过基准测试揭示了小部件感知与零样本泛化等关键挑战及数据规模对性能提升的重要性。

Aodi Wu, Jianhong Zuo, Zeyuan Zhao, Xubo Luo, Ruisuo Wang, Xue Wan2026-03-11🤖 cs.AI

Reading the Mood Behind Words: Integrating Prosody-Derived Emotional Context into Socially Responsive VR Agents

该论文提出了一种将语音情感识别模型推断的情绪标签作为显式上下文注入大语言模型驱动的社会化 VR 代理的交互流程,并通过用户研究证实该方法显著提升了对话质量、自然度及用户参与度,使 93.3% 的参与者更倾向于选择具备情感感知能力的代理。

SangYeop Jeong, Yeongseo Na, Seung Gyu Jeong, Jin-Woo Jeong, Seong-Eun Kim2026-03-11🤖 cs.AI

Beyond Scaling: Assessing Strategic Reasoning and Rapid Decision-Making Capability of LLMs in Zero-sum Environments

本文提出了 STAR 基准,这是一个基于多智能体零和博弈的评估框架,旨在揭示大型语言模型在静态推理之外,将战略深度转化为实时决策执行能力时存在的显著差距,并强调在动态对抗环境中平衡推理质量与响应速度的重要性。

Yang Li, Xing Chen, Yutao Liu, Gege Qi, Yanxian BI, Zizhe Wang, Yunjian Zhang, Yao Zhu2026-03-11🤖 cs.AI

Robust Regularized Policy Iteration under Transition Uncertainty

本文提出了一种名为鲁棒正则化策略迭代(RRPI)的新方法,通过将离线强化学习建模为在转移不确定性下的鲁棒策略优化问题,利用 KL 正则化将不可解的双层优化转化为可处理的单目标问题,从而在 D4RL 基准测试中实现了优于现有基线的性能并有效避免了分布外状态下的不可靠动作。

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu Zhang2026-03-11🤖 cs.AI

M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition

本文提出了 M3GCLR 框架,通过建立无限骨架数据博弈模型、引入多视角旋转增强与时间平均锚点、构建强对抗极小极大博弈及双损失均衡优化器,有效解决了现有自监督骨架动作识别方法在视角差异建模、对抗机制及增强扰动控制方面的局限,并在多个基准数据集上取得了优于或持平最先进水平的性能。

Yanshan Li, Ke Ma, Miaomiao Wei, Linhui Dai2026-03-11🤖 cs.AI