NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce is een neusgemonteerd interface dat door het fusioneren van akoestische en trillingssignalen een robuuste, onopvallende en altijd beschikbare spraakinteractie met AI mogelijk maakt, zelfs bij fluisterende spraak in lawaaierige omgevingen.

Jun Rekimoto, Yu Nishimura, Bojian Yang

Gepubliceerd Thu, 12 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een superkrachtige AI-assistent bij je hebt, altijd en overal. Je wilt haar iets fluisteren, een geheim delen of gewoon een idee opschrijven terwijl je in een drukke trein zit, zonder dat de mensen om je heen iets horen.

Helaas is dit tot nu toe heel lastig. Als je hardop spreekt, horen anderen mee. Als je fluistert, verdrinkt je stem in het lawaai van de omgeving. En als je probeert te "stille praten" (alleen je mond bewegen zonder geluid), moeten er vaak dure camera's of sensoren op je gezicht, wat niet zo handig of discreet is.

NasoVoce is de oplossing die de onderzoekers van Sony CSL hebben bedacht. Het is een slimme, onopvallende manier om met je AI te praten, zelfs als je fluistert en het om je heen een chaos is.

Hier is hoe het werkt, vertaald in alledaagse termen:

1. De Locatie: Het "Geheime Hoorpunt" op je Neus

De naam NasoVoce komt van het Italiaanse woord voor neus en stem. Het apparaatje zit op de neusbrug van een bril (zoals slimme brillen die je misschien wel eens ziet).

  • De Metafoor: Stel je voor dat je neusbrug een geheime tunnel is die rechtstreeks naar je mond leidt. Omdat het zo dicht bij je mond zit, vangt het twee soorten "boodschappen" tegelijk op:
    1. De luchtboodschap: Het geluid dat door de lucht reist (wat een microfoon doet).
    2. De trillingsboodschap: De trillingen die door je huid en bot gaan (wat een trillings-sensor doet).

2. Het Probleem: Twee Slechte Boodschappers

Normaal gesproken hebben we te maken met twee problemen:

  • De Microfoon (De Luie Luisteraar): Deze hoort heel goed als het stil is, maar als er een trein voorbijrijdt of iemand naast je praat, raakt hij in de war. Hij hoort alleen maar lawaai.
  • De Trillings-sensor (De Stevige, maar Dofe Luisteraar): Deze voelt de trillingen van je stem heel goed, zelfs als het buiten stormt. Maar omdat het via je huid gaat, klinkt je stem alsof je onder water spreekt: het is wat dof en minder duidelijk.

3. De Oplossing: Het "Tandem-Team"

NasoVoce combineert deze twee tot één superkrachtig team.

  • De Analogie: Denk aan een paar dansers.
    • De microfoon is de danser die de elegante bewegingen ziet (de klank), maar die snel struikelt als de vloer (de omgeving) onstabiel is.
    • De trillings-sensor is de danser die de grond voelt en nooit struikelt, maar die de elegante bewegingen niet goed kan zien.
    • NasoVoce is de choreograaf die ze samenbrengt. Als het lawaaiig is, laat hij de trillings-danser de leiding nemen. Als het stil is, laat hij de microfoon-danser de leiding nemen. Samen maken ze een perfecte dans: een stem die helder klinkt (door de microfoon) maar niet verstoord wordt door lawaai (door de trillings-sensor).

4. Waarom is dit speciaal? (Het Fluister-Geheim)

De echte kracht van NasoVoce zit in het fluisteren.

  • Normale microfoons op je oren (zoals AirPods) zijn zo goed in lawaai onderdrukken dat ze je fluisterstem soms per ongeluk ook onderdrukken, omdat ze denken dat het achtergrondruis is.
  • De trillings-sensor op je neus voelt echter de subtiele trillingen van je fluisterstem, zelfs als je mond dicht is of als je je hand ervoor houdt (voor extra privacy). Het systeem kan dus horen wat je fluistert, terwijl de mensen om je heen niets horen.

5. De Resultaten in het Dagelijks Leven

De onderzoekers hebben dit getest in echte situaties: in een drukke koffiezaak, op een drukke straat, terwijl je loopt en in een trein.

  • Zonder NasoVoce: De AI hoort alleen maar "rauw" of begrijpt niets.
  • Met NasoVoce: De AI hoort je stem kristalhelder, alsof je in een stil kantoor zit, terwijl je eigenlijk in een lawaaierige trein zit.

Samenvattend

NasoVoce is als een onzichtbare tolk die op je neus zit. Hij luistert naar wat je zegt (of fluistert) via twee verschillende kanalen, combineert de beste delen van beide, en zorgt dat je AI-assistent je altijd verstaat, ongeacht hoe luid de wereld om je heen is. Het maakt discreet praten met computers eindelijk mogelijk, zonder dat je er een masker voor hoeft te dragen of een camera op je gezicht hoeft te hebben.