NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction
이 논문은 환경 소음에 강건하면서도 저음량 발화까지 포착할 수 있도록 안경의 코받침에 마이크와 진동 센서를 융합한 'NasoVoce'라는 새로운 음성 인터페이스를 제안하고, 이를 통해 항상 가능한 조용하고 은밀한 AI 음성 대화의 실현 가능성을 입증했습니다.
2385 편의 논문
이 논문은 환경 소음에 강건하면서도 저음량 발화까지 포착할 수 있도록 안경의 코받침에 마이크와 진동 센서를 융합한 'NasoVoce'라는 새로운 음성 인터페이스를 제안하고, 이를 통해 항상 가능한 조용하고 은밀한 AI 음성 대화의 실현 가능성을 입증했습니다.
이 논문은 확산 기반 경로 계획의 안전성을 보장하기 위해, 충돌 위험을 정밀하게 평가하고 동역학적 제약을 준수하며 경로 일관성을 유지하는 검증 가능한 안전 필터 (PC-Diffuser) 를 확산 생성 과정에 직접 통합하는 프레임워크를 제안합니다.
이 논문은 TREC 2022 공정성 트랙 데이터를 활용해 추론 기반과 비추론 기반 재순위화 모델을 비교한 결과, 추론 기능이 공정성 (AWRF) 을 개선하거나 해치지 않으며 기존 순위의 공정성 특성을 유지한다는 것을 밝혔습니다.
이 논문은 혼잡한 환경에서 비전 - 언어 - 행동 (VLA) 모델의 성능 저하를 해결하기 위해, 지시문을 분석하고 Fourier 기반 인페인팅을 통해 시각적 노이즈를 제거하는 '개념 게이트 시각 증류 (CGVD)'라는 훈련 불필요 추론 프레임워크를 제안하여 정밀 조작 성공률을 획기적으로 향상시킨다는 내용입니다.
이 논문은 심한 비균등 분포와 글로벌 클래스 불균형 하에서 페더레이티드 액티브 러닝의 성능 저하 문제를 해결하기 위해, 글로벌 및 로컬 모델 간 적응적 선택과 클래스 인식 샘플링 전략을 통합한 'FairFAL' 프레임워크를 제안하고 그 우수성을 입증합니다.
이 논문은 다국어 LLM 평가에서 발생하는 번역체 편향을 완화하기 위해, 편향 요인을 명시적으로 분리하고 정보 병목 원리를 적용한 새로운 파인튜닝 프레임워크인 DIBJudge 를 제안합니다.
이 논문은 대규모 언어 모델 (LLM) 의 코드 생성 능력과 실제 네트워크 테스트베드를 결합하여 혼잡 제어 유틸리티 함수를 자동 설계하는 'GenCC' 프레임워크를 제안하고, 이를 통해 기존 최첨단 프로토콜보다 37%~142% 향상된 성능을 달성했음을 보여줍니다.
이 논문은 교사의 실패로 인한 '교사 한계'를 극복하고 학생 모델의 추론 능력을 향상시키기 위해, 엔트로피 기반의 힌트 주입, 퍼플렉시티-불확실성 비율 필터링, 그리고 점진적 커리큘럼 진화를 통합한 RL-free 프레임워크인 HEAL을 제안합니다.
이 논문은 대화 이력 인코딩과 선택된 슬롯의 구조적 정보를 동적 지식 융합을 통해 문맥 프롬프트로 활용함으로써, 다중 도메인 대화 상태 추적의 정확성과 일반화 성능을 크게 향상시키는 새로운 프레임워크를 제안합니다.
이 논문은 기존 생성형 추천 시스템의 비효율적인 토큰 인터리빙 방식을 개선하여, 아이템과 행동 간의 인과 관계를 명시적으로 모델링하는 새로운 아키텍처 (AttnLFA, AttnMVP) 를 제안함으로써 성능을 향상시키고 학습 시간을 단축하는 것을 목표로 합니다.
이 논문은 로봇이 고정된 모델 파라미터를 유지하면서 저차원의 '트렌드 ID'를 추정하고 시간적 정규화를 적용하여, 비정상적인 환경에서의 소량 샘플 적응을 가능하게 하는 새로운 프레임워크를 제안합니다.
이 논문은 AI 와의 공동 작성이 아이디어 생성보다 제안 수용을 우선시하는 '반응적 작문' 방식을 유도하여 작성자의 의견이 AI 의 영향에 무의식적으로 변화할 수 있음을 혼합 방법론 연구를 통해 규명했습니다.
이 논문은 희소 오토인코더와 미분 가능한 구조 학습을 결합하여 언어 모델의 잠재 공간에 인과적 개념 그래프 (CCG) 를 구축하고, 이를 통해 다단계 추론 과정에서 개념 간 인과 관계를 해석 가능하게 포착하며 개입 효과를 검증하는 새로운 프레임워크를 제안합니다.
이 논문은 GPT 스타일의 믹스처 오브 전문가 (MoE) 모델에서 총 연산량과 희소도에 따라 전문가 레이어와 어텐션 레이어 간의 최적 연산 배분 비율을 결정하는 새로운 스케일링 법칙을 제안하여, 고정된 연산 예산 내에서 MoE 모델의 효율적인 설계와 성능 최적화를 위한 실용적인 지침을 제공합니다.
이 논문은 LLM 의 추론 신뢰성을 평가하기 위해 확률적 스칼라 대신 '진전 (Progress)'과 '안정성 (Stability)'이라는 기하학적 개념을 도입한 TRACED 프레임워크를 제안하며, 이를 통해 할루시네이션과 올바른 추론을 구별하고 기계적 사고의 내부 역학을 해석할 수 있음을 보여줍니다.
이 논문은 제어 장벽 함수 (CBF) 와 순응적 위험 제어 (Conformal Risk Control) 를 결합하여 인간 행동의 복잡성을 고려하면서도 충돌 위험을 통계적으로 보장하는 새로운 확률적 안전 제어 프레임워크를 제안하고, 이를 통해 인간 - 로봇 상호작용 시 충돌률을 크게 낮추면서도 목표 도달 성공률을 유지하는 것을 입증합니다.
이 논문은 고전적 확률론적 프레임워크로는 포착하기 어려운 LLM 의 고차 불확실성을 해결하기 위해, 응답에 대한 불확실성 (1 차) 과 확률 모델 자체의 불확실성 (2 차) 을 정량화하는 새로운 불확실성 도출 기법을 제안합니다.
이 논문은 레이블 노이즈가 포함된 SGD 를 사용하는 2 층 선형 신경망의 학습 역학을 분석하여, 노이즈가 모델이 '게으른(regime)' 상태에서 '풍부한(rich)' 상태로 전환되도록 유도하고 일반화 성능을 향상시키는 두 단계 학습 메커니즘을 규명했다고 요약할 수 있습니다.
이 논문은 편향된 LLM 점수와 비용이 큰 인간 검증을 결합하여 서비스 시스템의 최적 구성을 효율적으로 식별하는 PP-LUCB 알고리즘을 제안하고, 이를 통해 검증 비용을 90% 절감하면서도 높은 정확도를 달성함을 보여줍니다.
이 논문은 기존 방법의 한계를 극복하기 위해 시공간 데이터의 시간과 공간 차원을 모두 압축하는 'STemDist'라는 새로운 데이터 증류 기법을 제안하여, 기존 방법 대비 훈련 속도를 최대 6 배, 메모리 효율을 최대 8 배 향상시키면서 예측 오차를 최대 12% 까지 낮추는 성과를 입증했습니다.