NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面,它通过融合麦克风与振动传感器的互补信号,在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。

Jun Rekimoto, Yu Nishimura, Bojian Yang

发布于 Thu, 12 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一个名为 NasoVoce(鼻语)的有趣发明。简单来说,它是一款戴在眼镜鼻托上的“隐形麦克风”,能让你在嘈杂的公共场合,甚至完全不出声的情况下,和 AI 进行私密的语音对话。

为了让你更容易理解,我们可以把这项技术想象成给眼镜装上了一个“超级耳朵”和“震动感应器”的混合体

1. 为什么要发明它?(解决什么痛点)

想象一下你在拥挤的地铁或嘈杂的咖啡馆里,想问 AI 一个私人问题,或者想让它帮你记个笔记:

  • 大声说话:不行,太吵了,而且泄露隐私。
  • 悄悄话(耳语):虽然小声了,但在嘈杂环境里,普通麦克风根本听不清,全是背景噪音。
  • 完全不出声(读唇语或动嘴型):现在的技术要么需要摄像头对着你的脸(侵犯隐私),要么只能识别几个简单的指令,没法进行流畅的聊天。

NasoVoce 的目标就是: 让你能像平时一样自然说话(或者轻轻耳语),AI 能听得清清楚楚,而且别人完全听不到,设备戴起来也不显眼。

2. 它是如何工作的?(核心黑科技)

NasoVoce 的核心在于它同时使用了两种“耳朵”,就像一个人既有“顺风耳”又有“震感觉”:

  • 耳朵 A:微型麦克风(空气传导)
    • 作用:它像普通麦克风一样,捕捉你嘴巴发出的声音。
    • 优点:声音很清晰,音质好。
    • 缺点:太容易受干扰了。就像你在暴风雨里听别人说话,风一吹就听不见了。
  • 耳朵 B:震动传感器(骨/皮肤传导)
    • 作用:它贴在鼻子上,感受你说话时鼻子和面部骨骼产生的微弱震动。
    • 优点:非常抗干扰!不管外面多吵,它只感受你身体内部的震动,就像你在水下听自己说话,外面的噪音进不来。
    • 缺点:声音听起来有点“闷”,像隔着墙听,不够清晰。

🌟 神奇的“混音师”(AI 模型):
NasoVoce 最厉害的地方在于,它不是二选一,而是把这两个信号融合在一起。
想象一下,你在嘈杂的派对上(麦克风信号),同时手里拿着一个能感受地板震动的仪器(震动信号)。AI 就像一个超级混音师,它利用“震动信号”来过滤掉噪音,再利用“麦克风信号”来修补声音的细节。

  • 结果:它生成了一种既清晰(像麦克风)又抗噪(像震动传感器)的完美声音。

3. 为什么戴在鼻子上?(位置的秘密)

为什么要把设备放在眼镜的鼻托上,而不是耳朵或喉咙?

  • 离嘴巴近:鼻子离嘴巴很近,能捕捉到说话时产生的气流和声音(哪怕是轻轻的耳语)。
  • 独特的震动:当你说话(甚至只是耳语)时,鼻腔和面部骨骼会产生独特的震动。以前的技术(比如贴在喉咙上)主要靠声带震动,但耳语时声带是不震动的,所以喉咙传感器听不到耳语。而鼻子不同,耳语时的气流和面部肌肉运动依然会让鼻子产生震动,这让 NasoVoce 能捕捉到别人听不到的“悄悄话”。
  • 隐蔽性:把它藏在眼镜鼻托上,就像眼镜的一部分,别人根本看不出来你在“说话”。

4. 实际效果怎么样?

研究人员做了很多测试,结果很令人兴奋:

  • 抗噪能力:在嘈杂的咖啡馆、火车上,普通的耳机(比如 AirPods)的“降噪模式”会把你的耳语当成噪音直接过滤掉,导致 AI 听不到。但 NasoVoce 依然能听清。
  • 识别率:即使在噪音很大的情况下,它的识别准确率也比单独用麦克风或单独用震动传感器要高得多。
  • 隐私保护:你可以用手捂住嘴巴和鼻子说话,这样别人既听不到声音,也看不到你的嘴唇动作(防唇语),完全私密。

5. 总结:这就像什么?

如果把现在的语音助手比作一个在闹市里大声喊话的人,那么 NasoVoce 就像是给这个人发了一副特制的“隐形眼镜”

  • 这副眼镜让他能在喧闹的集市中,用只有对方能听到的音量说话
  • 对方(AI)不仅能听到,还能自动屏蔽掉周围所有的叫卖声和喇叭声
  • 最重要的是,旁观者完全不知道他在说话,感觉他就像在发呆一样。

这项技术让“随时随地、私密、安静”地与 AI 对话成为可能,是未来智能眼镜和可穿戴设备的一大突破。