Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction
该论文提出了一种针对人机交互中领导者 - 跟随者角色分类的小语言模型基准,通过引入合成数据增强的数据集,证实了经过微调的小模型(如 Qwen2.5-0.5B)在零样本模式下能以低延迟实现高精度分类,优于提示工程方法,但在单样本模式下因上下文长度增加而面临性能下降的挑战。
323 篇论文
该论文提出了一种针对人机交互中领导者 - 跟随者角色分类的小语言模型基准,通过引入合成数据增强的数据集,证实了经过微调的小模型(如 Qwen2.5-0.5B)在零样本模式下能以低延迟实现高精度分类,优于提示工程方法,但在单样本模式下因上下文长度增加而面临性能下降的挑战。
本文提出了一种名为 DRAFTO 的新型机器人机械臂轨迹优化算法,通过解耦降维空间高斯 - 牛顿下降与自适应可行性修复机制,在确保关节极限等约束可行性的同时,显著提升了在多样化场景及复杂操作任务中的优化效率与可靠性。
本文提出了 TATIC 框架,通过结合基于力矩的接触力估计与任务感知时间卷积网络,从人机协作中的短暂物理修正中同时推断离散的任务级意图和连续的运动级参数,从而实现了机器人对动态任务约束和人类意图的在线自适应。
本文通过案例研究探讨了参数选择对改进蚁群算法收敛性的影响,并提出了针对工业分布式控制系统分层结构优化问题的参数调优建议。
该论文将不可逆端口哈密顿系统框架扩展至欧拉描述下的非等熵粘性流体,通过修正微分算子统一处理对流输运,并重新表述了欧拉与拉格朗日坐标下的本构关系,最终提出了一种满足热力学第一和第二定律的边界控制端口哈密顿系统通用类。
该论文针对多机器人多任务覆盖问题,在已知和未知感官需求两种场景下分别提出了联邦多任务覆盖算法与基于多任务高斯过程的自适应学习算法,并证明了后者在累积遗憾上具有次线性收敛性。
本文将不可逆端口哈密顿系统(IPHS)框架从一维推广至 N 维边界控制的分布参数系统,为描述传导 - 扩散流体现象提供了一个统一且热力学一致的建模方法,确保了全局能量平衡与熵产的正确表征,并为复杂多物理过程的系统建模、控制及结构保持数值离散奠定了基础。
本文提出了一种结合 MOTLEE 框架与自适应不确定性加权机制的分布式卡尔曼一致性滤波器,通过利用动态物体作为瞬态地标进行帧对齐并动态调整邻居信息权重,有效解决了移动机器人网络中因定位不确定性差异导致的轨迹不一致问题,显著提升了多目标跟踪性能。
本文建立了多阶段龙格 - 库塔方法在离散化无穷小收缩连续系统时保持强收缩性的条件,不仅为隐式方法提供了涵盖多种范数的显式系数判据,还通过辅助连续系统证明了其阶段方程的唯一可解性并提出了动态实现方案。
本文提出了名为 SliceFed 的新型联邦约束多智能体深度强化学习框架,通过将动态频谱切片建模为约束马尔可夫决策过程并结合拉格朗日原始 - 对偶方法与近端策略优化算法,在保护数据隐私的同时实现了 6G 网络中高效且满足严格低时延可靠性要求的资源分配。
本文针对传统非线性概率隐变量模型因变分后验参数化导致的近似误差问题,提出了一种基于 Wasserstein 距离松弛优化目标的新型软传感器模型 KProxNPLVM,通过严格的理论推导与实验验证,证明了该方法能有效规避近似误差并显著提升预测精度。
本文针对低空经济中动态目标感知挑战,提出了一种基于 ISAC 的多无人机协同感知方案,通过联合优化无人机与基站关联、飞行轨迹及带宽分配以最小化目标状态的后验克拉美罗界(PCRB),并设计了低复杂度迭代算法实现高效求解。
本文提出了一种基于混合多面体的方法,用于计算具有 ReLU 激活函数的闭环循环神经网络系统的精确前向与后向可达集,并通过一种可调节的松弛方案在计算复杂度与近似精度之间实现显式权衡,同时推导了系统安全性验证的充分条件。
该研究提出了一种基于多智能体深度强化学习的框架,利用虚拟锚节点协调无人机群进行协同感知,从而在甲烷泄漏源定位任务中实现了比传统通量法更优的精度与效率。
本文提出了一种旋转天线(RA)赋能的 covert 通信系统,通过联合优化发射波束成形向量与天线旋转角度,在满足隐蔽性、功率及旋转范围约束的前提下,利用交替优化算法显著提升了系统的隐蔽通信性能。
本文介绍了一种针对最优控制二次规划问题的 QPALM-OCP 求解器的并行化优化 C++ 实现,通过利用问题各阶段的可独立计算特性并结合向量化技术,显著提升了计算效率并验证了其在基准测试中的优越性。
本文提出了一种基于聚类分位数回归的概率预测框架,通过直接预测日前的最优热保护缩放因子,使英国低压配电变压器在控制过热风险的同时,相比静态设置提升了 10% 至 12% 的容量利用率。
本文提出了一种面向多区域异步互联电网的应急感知与频率约束型高压直流规划方法,通过构建协调应急频率控制方案及基于加权倾斜决策树的频率最低点安全约束,在考虑所有潜在故障场景下优化区域间联络线容量,从而有效平衡经济效率与频率安全。
本文提出了一种考虑电池老化内禀不确定性的微网鲁棒调度方法,通过构建基于 XGBoost 的概率老化模型并结合参数化模型预测控制框架,在极端温度条件下实现了电池寿命损耗与运行成本的全生命周期优化平衡。
该论文提出了一种基于代数投影和微扰理论的近似模型约化框架,用于处理马尔可夫开放量子动力学,该方法在构造上保证了完全正性和迹保持性,并提供了明确的误差界,从而有效描述了耗散多体系统中的非稳态长时动力学。