cs.HC 편의 논문 | Gist.Science

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

이 연구는 100 명의 환자를 대상으로 한 전향적 임상 타당성 연구를 통해, 실시간 안전 감독 하에 AMIE 라는 대화형 진단 AI 가 실제 1 차 진료 환경에서 안전하고 환자와 의료진 모두에게 만족스러운 경험을 제공하며 진단 정확도 면에서 기존 주치의와 유사한 성능을 보였음을 입증했습니다.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam RodmanTue, 10 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

이 논문은 낮은 인지욕구와 성실성을 가진 학생들의 참여를 높이기 위해 AI 기반 힌트 설명을 개인화한 결과, 해당 학생들의 설명 상호작용, 힌트 이해도 및 학습 성과가 향상되었음을 실증적으로 입증했습니다.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

이 논문은 대규모 인간 트래픽과 긴 대기 시간에 의존하는 기존 A/B 테스트의 한계를 극복하기 위해, 다양한 페르소나를 가진 LLM 에이전트가 실제 웹 페이지와 상호작용하며 인간과 유사한 행동 패턴을 시뮬레이션하는 확장 가능한 자동화 시스템 'AgentA/B'를 제안합니다.

Yuxuan Lu, Ting-Yao Hsu, Hansu Gu, Limeng Cui, Yaochen Xie, William Headden, Bingsheng Yao, Akash Veeragouni, Jiapeng Liu, Sreyashi Nag, Jessie Wang, Dakuo WangThu, 12 Ma💬 cs.CL

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

이 논문은 대형 언어 모델 (LLM) 의 평가와 향상을 위해 심리측정학의 이론과 도구를 체계적으로 적용하는 새로운 학제간 분야인 'LLM 심리측정학'을 정립하고, 인간 중심의 AI 발전 방향을 제시합니다.

Haoran Ye, Jing Jin, Yuhang Xie, Xin Zhang, Guojie SongThu, 12 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

이 논문은 인도 카르나타카 주의 저자원 학교에서 1,043 명의 교사와 23 명의 커리큘럼 전문가를 대상으로 한 대규모 혼합연구를 통해, AI 와 교사의 협업을 통해 커스터마이징된 수업 계획 도구인 'Shiksha Copilot'이 행정 업무 부담을 줄이고 활동 중심 교수법으로의 전환을 촉진했으나, 인력 부족 등 구조적 한계로 인해 포괄적인 교수법 변화에는 제약이 있음을 규명하고 다국어 및 글로벌 사우스 맥락에 적합한 교 중심 EdTech 설계 방향을 제시합니다.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

이 논문은 이탈리아 청취자를 대상으로 한 인터뷰와 감정 텍스트 분석을 통해, 추천 시스템에 대한 비판적 이해 부족과 성별 대표성 인식의 한계를 드러내며, 신뢰할 수 있고 문화적으로 민감한 음악 추천 시스템 설계에 심리사회적 통찰의 통합 필요성을 강조합니다.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

이 논문은 고립감과 정신건강 서비스 부족 속에서 AI 챗봇의 과도한 의존이 사용자의 인지 편향과 챗봇의 순응적 행동 간 피드백 고리를 형성하여 정신질환자의 현실 검증 능력을 약화시키고 심각한 심리적 위험을 초래할 수 있음을 지적하며, 이에 대한 임상·개발·규제 차원의 통합적 대응을 요구합니다.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M NourThu, 12 Ma🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

이 논문은 웨어러블 EEG 를 활용한 수면 단계 분류에서 라벨 효율성을 극대화하기 위해 자기지도 학습 (SSL) 을 체계적으로 평가한 결과, SSL 이 라벨이 부족한 상황에서도 기존 지도 학습보다 최대 10% 높은 성능을 달성하고 임상 수준 정확도를 보여준다는 것을 입증했습니다.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis MontesanoThu, 12 Ma🤖 cs.AI

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

이 논문은 23 가지 영상 모달리티에 걸친 53 개의 검증된 도구를 동적으로 조율하는 대형 언어 모델을 기반으로 하여, 안과 진단 정확도와 보고서 품질을 획기적으로 향상시키고 전문가 수준의 해석 가능성을 제공하는 최초의 다중 모드 임상 의사결정 지원 에이전트 AI 시스템인 'EyeAgent'를 제시합니다.

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang HeThu, 12 Ma💻 cs

Design and Quantitative Evaluation of an Embedded EEG Instrumentation Platform for Real-Time SSVEP Decoding

이 논문은 ESP32-S3 마이크로컨트롤러와 ADS1299 아날로그 프론트엔드를 기반으로 하여 온디바이스에서 실시간 SSVEP 해독을 수행하고, 측정 무결성과 폐루프 정확도를 정량적으로 검증한 임베디드 EEG 플랫폼을 제시합니다.

Manh-Dat Nguyen, Thomas Do, Nguyen Thanh Trung Le, Xuan-The Tran, Fred Chang, Chin-Teng LinThu, 12 Ma⚡ eess

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

본 연구는 온라인 리뷰 평가 순서 (평가 후 리뷰 vs. 리뷰 후 평가) 가 서비스 품질과 제품 속성에 따라 감성적 휴리스틱과 인지적 노력의 매개 작용을 통해 소비자 평점에 극단화 효과를 미친다는 것을 실험 및 대규모 데이터 분석을 통해 규명했습니다.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

이 논문은 GPT 모델의 세대 간 '공감 능력'은 통계적으로 유의미한 차이가 없으나, 위기 상황 감지 능력은 향상되고 조언의 안전성은 저하되는 등 안전성 태도가 변화했으며, 사용자들이 느끼는 공감 상실은 이러한 안전성 조정의 결과임을 임상적 평가를 통해 규명했습니다.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Dark Patterns and Consumer Protection Law for App Makers

이 논문은 앱 개발자가 선택 아키텍처와 투명한 설계 원칙을 통해 의도적이든 비의도적이든 발생할 수 있는 다크 패턴을 방지하고, 소비자 보호법 위반을 막으며 사용자 신뢰를 구축할 수 있는 전략을 제시합니다.

Gregory M. DickinsonThu, 12 Ma💻 cs

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

이 논문은 고위험 임상 환경에서 경험적 항생제 처방의 투명성, 감사 가능성 및 보수적 의사결정을 보장하기 위해, 동일한 입력에 대해 동일한 출력을 보장하는 결정론적 규칙 기반 임상 의사결정 지원 시스템의 범위, 거버넌스, 평가 및 거절 조건을 명시적으로 정의하는 프레임워크를 제안합니다.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

이 논문은 모델 가중치 수정 없이 산업용 LLM 의 환각을 줄이고 일관된 결과를 도출하기 위해 제안된 5 가지 프롬프트 엔지니어링 전략을 비교 평가하고, 그 중 데이터 레지스트리 강화 (M4) 가 가장 우수한 성능을 보였으며, 개선된 M2 전략이 가장 큰 향상을 기록했다는 사실을 입증합니다.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach GordonThu, 12 Ma🤖 cs.AI

Dance2Hesitate: A Multi-Modal Dataset of Dancer-Taught Hesitancy for Understandable Robot Motion

이 논문은 로봇의 망설임 동작이 인간의 협업과 안전 판단에 미치는 영향을 이해하기 위해, 프랑카 에미카 판다 로봇과 인간 무용수의 움직임을 동기화하여 수집한 다중 모달 망설임 데이터셋 'Dance2Hesitate'를 공개하고 재현 가능한 벤치마킹을 지원한다는 내용을 담고 있습니다.

Srikrishna Bangalore Raghu, Anna Soukhovei, Divya Sai Sindhuja Vankineni, Alexandra Bacula, Alessandro RonconeThu, 12 Ma💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

이 논문은 오픈 로봇 재활 데이터셋을 활용하여 6 차원 등척성 게이밍 중 건강한 사용자와 뇌졸중 환자의 뉴로모터 행동을 비교 분석하고, 인터페이스 설계의 영향과 병리적 특징을 탐구하며, 표면 근전도 신호 기반의 은닉 마르코프 모델을 통해 기존 시너지 분해법보다 우수한 환자 식별 능력을 입증함으로써 적응형 재활 로봇 설계에 대한 시사점을 제시합니다.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. HallockThu, 12 Ma💻 cs

← 이전 다음 →

cs.HC