Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots
이 논문은 의료 통역 로봇을 위해 오픈 소스 LLM 과 프라이버시 보호형 비전 - 언어 프레임워크를 활용하여 임상 대화의 의도를 감지하고 자연스러운 제스처를 생성하는 시스템을 제안하며, 새로운 데이터셋을 통해 높은 정확도와 인간적인 제스처 생성 성능을 입증했습니다.
255 편의 논문
이 논문은 의료 통역 로봇을 위해 오픈 소스 LLM 과 프라이버시 보호형 비전 - 언어 프레임워크를 활용하여 임상 대화의 의도를 감지하고 자연스러운 제스처를 생성하는 시스템을 제안하며, 새로운 데이터셋을 통해 높은 정확도와 인간적인 제스처 생성 성능을 입증했습니다.
이 논문은 120 명의 미국 독자를 대상으로 한 5 주간의 실증 연구를 통해, 뉴스의 국내 및 국제적 다양성을 확장하기 위해 제안된 이중 보정 알고리즘적 넛지가 노출과 소비 다양성을 성공적으로 증가시켰으며, LLM 기반 프레젠테이션 넛지의 효과는 다양했으나 개인화된 관련성 강조가 클릭에 더 유리함을 입증했습니다.
이 논문은 압력 분포를 실시간으로 측정하고 진동 피드백을 제공하는 폐루프 CPR 훈련 장갑을 제안하여, 외부 시각적 장치에 대한 의존을 줄이고 자가 훈련의 효율성을 높이는 가능성을 입증했습니다.
이 논문은 대화형 시각 분석 (CVA) 을 위한 대규모 언어 모델 (LLM) 의 평가 과제를 해결하기 위해, 개발자와 최종 사용자의 인터뷰를 바탕으로 실제 시나리오, 해석 가능한 다중 평가 지표, 그리고 프로그래밍 지식 없이도 결과를 탐색할 수 있는 대화형 툴킷 'Lexara'를 제안하고 그 유효성을 입증합니다.
이 논문은 15 명의 UX 디자이너를 대상으로 한 워크숍을 통해 AI 도입이 개인, 팀, 조직 차원에서 효율성, 책임, 자율성 등 다양한 가치의 협상 과정으로 이루어지며, 단순한 생산성 향상을 넘어 역할과 권력 관계가 재편되는 사회적 과정임을 주장합니다.
이 논문은 원격 화상 회의에서 데이터 시각화와 인터페이스 위젯을 상대방의 미러 영상 위에 반사적으로 중첩시켜 양측이 양손 제스처로 동시에 조작할 수 있는 '글래스 치올리틱스 (Glass Chirolytics)' 방식을 제안하고, 이를 통해 공유된 분석 의도에 대한 상호 인식과 현장감을 향상시킬 수 있음을 입증합니다.
이 논문은 인간-컴퓨터 상호작용 및 시각화 분야의 29 명의 전문가들이 시각화 기반의 원격 동시 협업을 방해하는 16 가지 주요 과제를 식별하고, 이를 기술적 선택, 사회적 요인, AI 지원, 평가라는 네 가지 연구 개발 영역과 연계하여 향후 연구 방향을 제시합니다.
이 논문은 의료 의사결정 시나리오를 대상으로 한 사용자 연구를 통해, 데이터 분포의 불균형 (infra-marginality) 이 공정성 인식에 미치는 영향을 분석하고, 사람들이 단순한 통계적 평등보다는 결과의 원인과 맥락에 기반한 공정성을 판단함을 보여주었습니다.
이 논문은 혼합현실 (MR) 환경에서 알림의 중요도에 따라 공간적 위치를 동적으로 조정하는 적응형 알림 시스템을 제안하고, 실험을 통해 이를 기존 중앙 고정 방식보다 정신적 부하와 좌절감을 줄이면서 알림 인지도를 유지하는 효과적인 방법임을 입증했습니다.
이 논문은 사용자의 멀티모달 상호작용 데이터를 기반으로 다음 행동을 예측하는 'LongNAP' 모델을 제안하고, 이를 통해 방대한 양의 자연스러운 사용자 행동 데이터를 학습하여 개인화된 행동 예측 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 대규모 언어 모델 (8B Llama) 에 대해 저자의 언어적 맥락을 고려한 HuLM 과 HuFT 기법을 적용하여 생태학적 오류를 해결함으로써, 기존 표준 미세조정 방식보다 다양한 하위 작업에서 성능을 크게 향상시킬 수 있음을 입증했습니다.
이 논문은 개인적 성향과 상황적 맥락의 상호작용을 기반으로 한 이론적 프레임워크와 대규모 언어 모델을 결합하여, 해석 가능성과 예측 성능을 동시에 확보하는 동적 정신 건강 평가 모델을 개발하고 그 유효성을 입증합니다.
이 논문은 눈동자 운동과 이해력을 연결하는 통합 원리로 '계층적 자원 합리성'을 제시하며, 이 모델이 인간의 독서 행동을 포괄적으로 설명하고 다양한 실험 결과를 성공적으로 재현함을 보여줍니다.
이 논문은 생성형 AI 와 음성 합성 기술을 활용하여 사용자의 말과 행동을 AI 가 대신 수행하거나 변형하는 'ProxyMe'라는 VR 프로토타입을 소개하며, AI 매개 커뮤니케이션이 사용자의 자아 확장으로 경험되는 현상과 관련된 설계, 구현, 그리고 연구 과제를 탐구합니다.
이 논문은 시각화된 인지적 진단 및 대조적·반사실적 설명을 제공하는 XIA 플랫폼이 예비 교사의 평가 문해력 함양과 성찰적 사고 증진에 효과적임을 실증 연구로 보여줍니다.
이 논문은 VR 피아노 학습에서 학습자의 실시간 수행도에 따라 유령 인스트럭터의 불투명도를 동적으로 조절하는 '기술 적응형' 방식을 도입함으로써, 고정된 시각적 단서에 대한 의존성을 줄이고 피아노 연주 기술의 내재화 및 단기 유지율을 향상시켰음을 30 명 대상 실험을 통해 입증했습니다.
이 연구는 초등학생들이 사회적 보조 로봇을 활용한 역할극을 통해 갈등 해결을 연습하는 과정에 대한 탐색적 연구를 수행하여, 로봇 기반 중재 활동이 학생들의 자아 존중감과 친구 돕기 능력 향상에 유망한 효과가 있음을 확인하고 향후 연구 설계를 위한 통찰을 제시했습니다.
본 연구는 4 주간의 신체 활동 개입 실험을 통해, LLM 기반 메시지가 템플릿보다 유용하게 평가되었으나 구조화된 탐색을 위한 컨텍스트 밴딧 최적화는 LLM 단독 방식보다 추가적인 유용성을 제공하지 못했으며, 오히려 사용자의 입력에 대한 맥락적 인정이 지각된 유용성을 결정하는 핵심 요소임을 규명했습니다.
이 논문은 가상현실 환경에서 아바타가 사용자의 확장된 능력을 직관적으로 전달할 수 있도록 12 명의 전문가를 대상으로 한 디자인 연구와 24 명의 참가자를 통한 검증을 거쳐 16 가지의 구체적인 디자인 가이드라인을 제안하고 그 유효성을 입증합니다.
이 논문은 프라이버시와 사회적 불편함을 해소하기 위해 필요할 때만 착용하는 귀형 웨어러블 AI 장치 'The Pen'을 제안하고, 이를 통해 사용자의 주도성, 인지적 흐름 및 사회적 편안함을 형성하는 계층적 활성화 경계의 중요성을 탐구합니다.