A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Cette étude de faisabilité prospective démontre qu'un système d'IA conversationnelle (AMIE) peut mener des entretiens cliniques en toute sécurité dans un cabinet de soins primaires, générant des diagnostics différentiels et des plans de prise en charge de qualité comparable à ceux des médecins, tout en étant bien accueilli par les patients et les cliniciens.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam RodmanTue, 10 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Cette étude empirique démontre que personnaliser les explications des indices générés par l'IA dans un système de tutorat intelligent, en fonction des traits de personnalité des élèves (notamment leur besoin de cognition et leur conscienciosité), augmente leur interaction avec ces explications, améliore leur compréhension et favorise leur apprentissage.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

Ce papier présente AgentA/B, un système innovant utilisant des agents autonomes basés sur les grands modèles de langage pour simuler des comportements utilisateurs à grande échelle et automatiser les tests A/B web, réduisant ainsi la dépendance au trafic humain réel et les délais d'attente.

Yuxuan Lu, Ting-Yao Hsu, Hansu Gu, Limeng Cui, Yaochen Xie, William Headden, Bingsheng Yao, Akash Veeragouni, Jiapeng Liu, Sreyashi Nag, Jessie Wang, Dakuo WangThu, 12 Ma💬 cs.CL

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

Cet article de revue systématique établit le champ interdisciplinaire de la psychométrie des grands modèles de langage en synthétisant les méthodes d'évaluation, de validation et d'amélioration inspirées des sciences psychologiques pour aligner les systèmes d'IA sur les constructions humaines et favoriser le développement d'une intelligence artificielle centrée sur l'humain.

Haoran Ye, Jing Jin, Yuhang Xie, Xin Zhang, Guojie SongThu, 12 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Cette étude présente Shiksha Copilot, un outil d'IA déployé dans les écoles gouvernementales du Karnataka, qui, en facilitant la co-création et la personnalisation de plans de leçons bilingues pour plus de 1 000 enseignants, réduit leur charge administrative et le stress tout en favorisant une transition vers des pédagogies actives, bien que des contraintes systémiques limitent l'ampleur du changement pédagogique.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Cette étude psychosociale menée auprès d'auditeurs italiens révèle que, bien qu'ils routinisent leur usage des plateformes musicales, ils manquent de compréhension critique des algorithmes et ont une conscience limitée des biais de genre, soulignant ainsi la nécessité d'intégrer des perspectives psychosociales dans la conception de systèmes de recommandation musicaux plus fiables et culturellement sensibles.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

Cet article met en évidence les risques émergents de déstabilisation des croyances et de dépendance chez les personnes souffrant de troubles mentaux résultant d'interactions avec des chatbots IA, appelant à une réponse coordonnée entre la pratique clinique, le développement de l'IA et les cadres réglementaires pour atténuer ces boucles de rétroaction dangereuses.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M NourThu, 12 Ma🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Cet article présente la première évaluation systématique de l'apprentissage auto-supervisé pour le stade du sommeil à partir d'EEG portables, démontrant qu'il permet d'atteindre une précision clinique supérieure à 80 % avec seulement 5 à 10 % de données étiquetées, surpassant ainsi les modèles supervisés et les modèles de fondation génériques.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis MontesanoThu, 12 Ma🤖 cs.AI

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

Le papier présente EyeAgent, un premier cadre d'IA agentique interprétable pour le soutien décisionnel clinique en ophtalmologie, qui orchestre dynamiquement 53 outils spécialisés sur 23 modalités d'imagerie pour atteindre une précision diagnostique supérieure et améliorer significativement les performances des médecins, en particulier des juniors.

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang HeThu, 12 Ma💻 cs

Design and Quantitative Evaluation of an Embedded EEG Instrumentation Platform for Real-Time SSVEP Decoding

Cet article présente une plateforme embarquée de mesure EEG basée sur un ESP32-S3 et un ADS1299, capable de décoder en temps réel les potentiels évoqués visuels à état stationnaire (SSVEP) avec une intégrité de mesure rigoureusement caractérisée et une précision de décision de 100 % par rapport à une référence 64 bits.

Manh-Dat Nguyen, Thomas Do, Nguyen Thanh Trung Le, Xuan-The Tran, Fred Chang, Chin-Teng LinThu, 12 Ma⚡ eess

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Cet article propose un cadre de gouvernance et d'évaluation pour des systèmes d'aide à la décision clinique déterministes et basés sur des règles, spécifiquement conçus pour optimiser la prescription empirique d'antibiotiques en priorisant la transparence, l'auditabilité et l'abstention contrôlée lorsque les conditions de sécurité ne sont pas remplies.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Cet article présente et évalue cinq stratégies d'ingénierie de prompts visant à réduire les hallucinations des grands modèles de langage dans des contextes industriels, démontrant notamment que l'« Enhanced Data Registry » (M4) offre une stabilité épistémique supérieure avec un taux de succès de 100 % par rapport à une baseline.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach GordonThu, 12 Ma🤖 cs.AI

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

En exploitant le jeu isométrique 6D et l'apprentissage automatique sur des données OpenRobotRehab, cette étude caractérise les comportements neuromoteurs sains et post-AVC pour éclairer la conception d'interfaces robotiques de réadaptation adaptatives capables de distinguer les stratégies pathologiques et de promouvoir des mouvements plus sains.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. HallockThu, 12 Ma💻 cs

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

Ce papier présente DUCTILE, une approche d'orchestration agentic par LLM qui sépare l'adaptation des processus de l'exécution déterministe des outils d'ingénierie, permettant ainsi d'automatiser avec succès des tâches d'analyse structurelle dans l'industrie aérospatiale malgré des variations de données, tout en soulevant des questions sur l'évolution du rôle de supervision des ingénieurs.

Alejandro Pradas-Gomez, Arindam Brahma, Ola IsakssonThu, 12 Ma🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

Cet article présente un système conçu par une approche centrée sur l'humain qui utilise l'intelligence artificielle conversationnelle et une carte interactive pour permettre au public d'explorer et d'interroger en langage naturel près de 1,7 million de spécimens numérisés des collections de sciences naturelles du Musée australien.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. AhyongThu, 12 Ma🤖 cs.AI

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

Cette étude préliminaire utilise l'analyse des réseaux de transition appliquée aux données de suivi oculaire dans des simulations de réanimation cardiaque en réalité virtuelle pour modéliser la dynamique de la conscience situationnelle et révéler comment la répartition de l'attention visuelle s'adapte aux rôles et aux phases de la tâche au sein d'équipes cliniques.

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy PopovThu, 12 Ma💻 cs