NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction
NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面,它通过融合麦克风与振动传感器的互补信号,在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。
2385 篇论文
NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面,它通过融合麦克风与振动传感器的互补信号,在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。
本文提出了 PC-Diffuser 框架,通过将基于胶囊距离的证书化路径一致障碍函数直接嵌入扩散规划的去噪循环中,实现了在保持轨迹几何特征的同时进行迭代式、上下文感知的安全过滤,从而解决了数据驱动轨迹规划器在复杂场景下难以认证和易发生灾难性故障的问题。
该论文首次系统比较了推理与非推理重排序模型在公平性上的表现,发现推理能力本身并未改善或损害公平性,当前模型仅保留了输入排序的公平特征,而地理属性上的公平性差距普遍存在,表明未来需专门设计具备公平感知能力的推理模型。
本文提出了一种无需训练且模型无关的推理框架“概念门控视觉蒸馏”(CGVD),通过指令解析、目标细化及基于傅里叶变换的图像修复技术,有效抑制视觉噪声并保留关键几何信息,从而显著提升了视觉 - 语言 - 动作模型在高度杂乱环境中的操作成功率。
本文针对联邦主动学习在极端非独立同分布和全局类别不平衡场景下的性能退化问题,提出了一种名为 FairFAL 的自适应框架,通过轻量级预测差异自适应选择查询模型、利用全局特征进行原型引导的伪标签生成以及两阶段不确定性 - 多样性平衡采样策略,显著提升了长尾和非独立同分布设置下的最终性能。
本文提出了名为 DIBJudge 的鲁棒微调框架,通过变分信息压缩和交叉协方差惩罚将判断关键表示与翻译偏差因素解耦,从而有效缓解多语言大模型评估中存在的系统性“翻译腔”偏差。
该论文提出了 GenCC 框架,利用大语言模型结合真实网络测试床自动生成拥塞控制效用函数,在考虑应用特定需求和网络容量的情况下,将现有最优协议的性能提升了 37% 至 142%。
本文提出了名为 HEAL 的无强化学习框架,通过结合引导熵辅助修复、困惑度 - 不确定性比率估计及渐进式答案引导课程演化三大核心模块,有效突破了传统知识蒸馏中教师模型能力上限的制约,显著提升了小型模型从大型推理模型中学习复杂推理能力的水准。
该论文提出了一种动态知识融合框架,通过对比学习编码对话历史与候选槽位,并利用结构化槽位信息作为上下文提示,有效解决了多领域对话状态追踪中历史建模困难和标注数据稀缺的问题,显著提升了追踪准确率与泛化能力。
该论文针对现有生成式推荐系统中交错建模导致的效率低下与注意力噪声问题,提出了 AttnLFA 和 AttnMVP 两种新架构,通过显式建模“物品 - 行为”的因果依赖关系替代交错机制,在显著降低序列复杂度与训练时间的同时提升了推荐性能。
该论文提出了一种基于潜在趋势标识(Trend ID)的框架,通过在保持模型参数固定的情况下估计低维环境状态并引入时间正则化,实现了机器人在非平稳环境中无需更新权重的少样本适应,从而有效解决了概念漂移问题并避免了灾难性遗忘。
该研究通过混合方法揭示了在 AI 辅助写作中,用户因过度依赖“先评估建议后构思”的“反应式写作”模式,在不知不觉中被 AI 引导并改变观点,却误以为自己仍完全掌控写作过程。
该论文提出了因果概念图(CCG)框架,通过结合任务条件稀疏自编码器与可微结构学习,在语言模型潜在空间中构建概念间的因果依赖关系,从而显著提升了多步推理任务中干预操作的有效性与可解释性。
该论文通过实验发现混合专家(MoE)模型中专家层与注意力层的计算分配比例遵循幂律关系,并据此提出了扩展的 Chinchilla 缩放定律,为在固定计算预算下优化 MoE 模型设计提供了明确的理论公式与实践指南。
该论文提出了名为 TRACED 的框架,通过将推理过程解构为“进展”(位移)与“稳定性”(曲率)的几何动力学特征,有效区分了正确推理与幻觉模式,从而为评估大语言模型的推理质量提供了超越传统标量概率的鲁棒性新方法。
本文提出了一种结合控制障碍函数与保形风险控制的新型概率安全控制框架,通过动态调整安全裕度来量化预测误差,从而在复杂人机交互中提供形式化安全保证,显著降低了碰撞率并保持了任务成功率。
该论文针对大语言模型在模糊问答等场景下传统概率框架无法准确捕捉其不确定性行为的局限,提出了一种基于不精确概率的新型提示与后处理方法,旨在通过量化一阶(响应不确定性)和二阶(模型本身的不确定性)不确定性,实现更可信的模型不确定性表达并辅助下游决策。
该论文通过理论分析与实验验证,揭示了标签噪声 SGD 在两层过参数化线性网络中通过驱动模型从“懒惰”区域向“丰富”区域转变并增强权重与真实插值器的对齐,从而解释了其提升泛化能力的内在机制,并将该发现推广至锐度感知最小化(SAM)等更广泛的优化算法。
该论文针对服务系统配置优化中 LLM 自动评分存在偏差而人工审核成本高昂的问题,提出了一种名为 PP-LUCB 的序贯决策算法,通过结合代理分数与逆倾向加权残差估计,在显著降低人工审计成本的同时,以高置信度准确识别出最优服务配置。
本文提出了首个专门针对时空时间序列预测的数据集蒸馏方法 STemDist,通过平衡压缩时空维度并结合粗粒度聚类与细粒度子集蒸馏技术,在显著降低训练时间和内存消耗的同时,实现了比现有方法更低的预测误差。