A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

이 연구는 100 명의 환자를 대상으로 한 전향적 임상 타당성 연구를 통해, 실시간 안전 감독 하에 AMIE 라는 대화형 진단 AI 가 실제 1 차 진료 환경에서 안전하고 환자와 의료진 모두에게 만족스러운 경험을 제공하며 진단 정확도 면에서 기존 주치의와 유사한 성능을 보였음을 입증했습니다.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam RodmanTue, 10 Ma🤖 cs.LG

AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

이 논문은 대규모 인간 트래픽과 긴 대기 시간에 의존하는 기존 A/B 테스트의 한계를 극복하기 위해, 다양한 페르소나를 가진 LLM 에이전트가 실제 웹 페이지와 상호작용하며 인간과 유사한 행동 패턴을 시뮬레이션하는 확장 가능한 자동화 시스템 'AgentA/B'를 제안합니다.

Yuxuan Lu, Ting-Yao Hsu, Hansu Gu, Limeng Cui, Yaochen Xie, William Headden, Bingsheng Yao, Akash Veeragouni, Jiapeng Liu, Sreyashi Nag, Jessie Wang, Dakuo WangThu, 12 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

이 논문은 인도 카르나타카 주의 저자원 학교에서 1,043 명의 교사와 23 명의 커리큘럼 전문가를 대상으로 한 대규모 혼합연구를 통해, AI 와 교사의 협업을 통해 커스터마이징된 수업 계획 도구인 'Shiksha Copilot'이 행정 업무 부담을 줄이고 활동 중심 교수법으로의 전환을 촉진했으나, 인력 부족 등 구조적 한계로 인해 포괄적인 교수법 변화에는 제약이 있음을 규명하고 다국어 및 글로벌 사우스 맥락에 적합한 교 중심 EdTech 설계 방향을 제시합니다.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

이 논문은 이탈리아 청취자를 대상으로 한 인터뷰와 감정 텍스트 분석을 통해, 추천 시스템에 대한 비판적 이해 부족과 성별 대표성 인식의 한계를 드러내며, 신뢰할 수 있고 문화적으로 민감한 음악 추천 시스템 설계에 심리사회적 통찰의 통합 필요성을 강조합니다.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

이 논문은 고립감과 정신건강 서비스 부족 속에서 AI 챗봇의 과도한 의존이 사용자의 인지 편향과 챗봇의 순응적 행동 간 피드백 고리를 형성하여 정신질환자의 현실 검증 능력을 약화시키고 심각한 심리적 위험을 초래할 수 있음을 지적하며, 이에 대한 임상·개발·규제 차원의 통합적 대응을 요구합니다.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M NourThu, 12 Ma🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

이 논문은 웨어러블 EEG 를 활용한 수면 단계 분류에서 라벨 효율성을 극대화하기 위해 자기지도 학습 (SSL) 을 체계적으로 평가한 결과, SSL 이 라벨이 부족한 상황에서도 기존 지도 학습보다 최대 10% 높은 성능을 달성하고 임상 수준 정확도를 보여준다는 것을 입증했습니다.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis MontesanoThu, 12 Ma🤖 cs.AI

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

이 논문은 23 가지 영상 모달리티에 걸친 53 개의 검증된 도구를 동적으로 조율하는 대형 언어 모델을 기반으로 하여, 안과 진단 정확도와 보고서 품질을 획기적으로 향상시키고 전문가 수준의 해석 가능성을 제공하는 최초의 다중 모드 임상 의사결정 지원 에이전트 AI 시스템인 'EyeAgent'를 제시합니다.

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang HeThu, 12 Ma💻 cs

Design and Quantitative Evaluation of an Embedded EEG Instrumentation Platform for Real-Time SSVEP Decoding

이 논문은 ESP32-S3 마이크로컨트롤러와 ADS1299 아날로그 프론트엔드를 기반으로 하여 온디바이스에서 실시간 SSVEP 해독을 수행하고, 측정 무결성과 폐루프 정확도를 정량적으로 검증한 임베디드 EEG 플랫폼을 제시합니다.

Manh-Dat Nguyen, Thomas Do, Nguyen Thanh Trung Le, Xuan-The Tran, Fred Chang, Chin-Teng LinThu, 12 Ma⚡ eess

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

이 논문은 GPT 모델의 세대 간 '공감 능력'은 통계적으로 유의미한 차이가 없으나, 위기 상황 감지 능력은 향상되고 조언의 안전성은 저하되는 등 안전성 태도가 변화했으며, 사용자들이 느끼는 공감 상실은 이러한 안전성 조정의 결과임을 임상적 평가를 통해 규명했습니다.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

이 논문은 고위험 임상 환경에서 경험적 항생제 처방의 투명성, 감사 가능성 및 보수적 의사결정을 보장하기 위해, 동일한 입력에 대해 동일한 출력을 보장하는 결정론적 규칙 기반 임상 의사결정 지원 시스템의 범위, 거버넌스, 평가 및 거절 조건을 명시적으로 정의하는 프레임워크를 제안합니다.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

이 논문은 모델 가중치 수정 없이 산업용 LLM 의 환각을 줄이고 일관된 결과를 도출하기 위해 제안된 5 가지 프롬프트 엔지니어링 전략을 비교 평가하고, 그 중 데이터 레지스트리 강화 (M4) 가 가장 우수한 성능을 보였으며, 개선된 M2 전략이 가장 큰 향상을 기록했다는 사실을 입증합니다.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach GordonThu, 12 Ma🤖 cs.AI

Dance2Hesitate: A Multi-Modal Dataset of Dancer-Taught Hesitancy for Understandable Robot Motion

이 논문은 로봇의 망설임 동작이 인간의 협업과 안전 판단에 미치는 영향을 이해하기 위해, 프랑카 에미카 판다 로봇과 인간 무용수의 움직임을 동기화하여 수집한 다중 모달 망설임 데이터셋 'Dance2Hesitate'를 공개하고 재현 가능한 벤치마킹을 지원한다는 내용을 담고 있습니다.

Srikrishna Bangalore Raghu, Anna Soukhovei, Divya Sai Sindhuja Vankineni, Alexandra Bacula, Alessandro RonconeThu, 12 Ma💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

이 논문은 오픈 로봇 재활 데이터셋을 활용하여 6 차원 등척성 게이밍 중 건강한 사용자와 뇌졸중 환자의 뉴로모터 행동을 비교 분석하고, 인터페이스 설계의 영향과 병리적 특징을 탐구하며, 표면 근전도 신호 기반의 은닉 마르코프 모델을 통해 기존 시너지 분해법보다 우수한 환자 식별 능력을 입증함으로써 적응형 재활 로봇 설계에 대한 시사점을 제시합니다.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. HallockThu, 12 Ma💻 cs

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

이 논문은 제품 개발 과정에서 도구와 데이터 형식의 변화로 인해 기존 자동화가 실패하는 문제를 해결하기 위해, LLM 에이전트가 유연하게 작업을 조정하고 엔지니어가 최종 판단을 내리는 'DUCTILE'이라는 새로운 엔지니어링 분석 자동화 접근법을 제안하고 항공우주 산업의 구조 해석 사례를 통해 그 유효성을 입증했습니다.

Alejandro Pradas-Gomez, Arindam Brahma, Ola IsakssonThu, 12 Ma🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

이 논문은 오스트레일리아 박물관의 170 만 건 이상의 표본 데이터를 자연어 대화형 AI 와 인터랙티브 지도를 통해 실시간으로 탐색할 수 있도록 설계한 시스템을 제안하며, 대규모 자연사 박물관 컬렉션에 대한 대중 접근성을 혁신하는 새로운 방식을 제시합니다.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. AhyongThu, 12 Ma🤖 cs.AI

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

이 연구는 40 명의 임상 전문가가 참여한 가상현실 심정지 시뮬레이션 중의 안구 추적 데이터를 전환 네트워크 분석 (TNA) 에 적용하여, 역할과 시나리오 단계에 따라 시각적 주의가 어떻게 역동적으로 재분배되는지를 규명함으로써 팀 인지 기능의 분화를 매핑하고 급성 요양 훈련을 위한 새로운 분석 도구를 제시합니다.

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy PopovThu, 12 Ma💻 cs