A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Deze prospectieve haalbaarheidsstudie toont aan dat een conversational AI (AMIE) in een echte huisartsenpraktijk veilig en effectief kan worden ingezet voor het verzamelen van anamnese en het formuleren van differentiaaldiagnoses, waarbij de kwaliteit vergelijkbaar was met die van huisartsen, hoewel de huisartsen nog steeds beter scoorden op praktische uitvoerbaarheid en kosten-effectiviteit.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam RodmanTue, 10 Ma🤖 cs.LG

AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

Dit paper introduceert AgentA/B, een systeem dat autonome LLM-agenten gebruikt om schaalbare en snelle A/B-tests voor webapplicaties uit te voeren door menselijke gebruikersgedragingen te simuleren, waarmee de afhankelijkheid van grote hoeveelheden live menselijk verkeer wordt verminderd.

Yuxuan Lu, Ting-Yao Hsu, Hansu Gu, Limeng Cui, Yaochen Xie, William Headden, Bingsheng Yao, Akash Veeragouni, Jiapeng Liu, Sreyashi Nag, Jessie Wang, Dakuo WangThu, 12 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Dit onderzoek analyseert de effecten van Shiksha Copilot, een AI-gestuurde tool voor lesplanning in Indiase scholen, en concludeert dat deze het administratieve werklast en stress verlaagt en de leskwaliteit verbetert, hoewel structurele uitdagingen zoals personeelstekorten de volledige pedagogische transformatie beperken.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Dit onderzoek analyseert via psychosociale interviews met Italiaanse luisteraars hoe zij omgaan met muziekrecommenderingsystemen, waarbij blijkt dat hoewel ze routinematig gebruikmaken van deze platforms, ze vaak een gebrek aan kritisch inzicht hebben in de algoritmen en beperkt bewust zijn van gendergerelateerde representatieproblemen, wat de noodzaak benadrukt om psychosociale inzichten te integreren in het ontwerp van cultureel gevoelige systemen.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

Dit artikel waarschuwt dat de interactie tussen kwetsbare gebruikers met mentale gezondheidsproblemen en AI-chatbots, versterkt door cognitieve vooroordelen en het meegaande gedrag van de bots, kan leiden tot geloofsontstabilisatie en afhankelijkheid, wat urgente gecoördineerde actie vereist op het gebied van klinische praktijk, AI-ontwikkeling en regelgeving.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M NourThu, 12 Ma🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Dit artikel presenteert de eerste systematische evaluatie van zelftoezichthoudend leren (SSL) voor slaapstadiëring met draagbare EEG, waarbij wordt aangetoond dat deze aanpak de prestaties aanzienlijk verbetert en klinisch bruikbare nauwkeurigheid bereikt met slechts 5% tot 10% van de benodigde gelabelde data.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis MontesanoThu, 12 Ma🤖 cs.AI

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

Dit paper introduceert EyeAgent, het eerste agentic AI-systeem voor ophthalmologie dat een groot taalmodel combineert met 53 gespecialiseerde hulpmiddelen om interpretabele klinische beslissingen te ondersteunen en de diagnostische nauwkeurigheid van artsen, met name junior oogartsen, aanzienlijk te verbeteren.

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang HeThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Dit onderzoek toont aan dat de volgorde van beoordeling (eerst een cijfer geven versus eerst een review schrijven) consumentenbeoordelingen polariseert via een combinatie van affectieve heuristieken en cognitieve inspanning, waarbij de volgorde 'eerst cijfer' leidt tot extremere scores afhankelijk van de servicekwaliteit en producttype.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Hoewel de empathie van OpenAI-modellen statistisch onveranderd is gebleven, toont deze studie aan dat gebruikers de 'verloren empathie' waarnemen als een verschuiving in veiligheidsinstellingen, waarbij modellen nu crises beter detecteren maar soms te veel advies geven, wat leidt tot een waarneembaar maar onzichtbaar compromis voor kwetsbare gebruikers.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Dit artikel introduceert een governance- en evaluatiekader voor deterministische, regelgebaseerde klinische besluitvormingssystemen bij empirisch antibioticumvoorschrijven, dat transparantie, auditbaarheid en conservatief gedrag waarborgt door expliciete abstentievoorwaarden en een validatiemethode op basis van synthetische casussen te definiëren.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Dit paper introduceert en evalueert vijf prompt-engineeringstrategieën om hallucinaties in industriële LLM-toepassingen te verminderen, waarbij de 'Enhanced Data Registry'-methode (M4) de meest consistente resultaten boekte en een geoptimaliseerde versie van de 'Decomposed Model-Agnostic Prompting'-methode (M2) de grootste verbetering liet zien.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach GordonThu, 12 Ma🤖 cs.AI

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

Dit artikel analyseert het gedrag van gezonde en post-ictale gebruikers tijdens isometrisch 6D-gamen met een end-effector revalidatierobot en presenteert een nieuwe HMM-gebaseerde classificatiemethode op basis van sEMG-signalen om pathologische neuromotorische patronen te onderscheiden, met als doel de ontwerpprincipes voor adaptieve revalidatieinterfaces te optimaliseren.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. HallockThu, 12 Ma💻 cs

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

Dit artikel introduceert DUCTILE, een agente LLM-orchestratie die engineeringanalyse in de productontwikkeling automatiseert door adaptieve aanpassing van veranderende interfaces te combineren met deterministische tooluitvoering onder menselijk toezicht, wat leidt tot robuuste resultaten maar ook nieuwe uitdagingen voor de ingenieursrol met zich meebrengt.

Alejandro Pradas-Gomez, Arindam Brahma, Ola IsakssonThu, 12 Ma🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

Dit paper presenteert een door conversational AI aangedreven verkenningssysteem dat, ontwikkeld via een mensgerichte ontwerpproces, het publiek in staat stelt om via natuurlijke taal en een interactieve kaart de bijna 1,7 miljoen gedigitaliseerde specimenrecords van het Australian Museum te doorzoeken en te begrijpen.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. AhyongThu, 12 Ma🤖 cs.AI

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

In deze voorlopige studie wordt Transition Network Analysis toegepast op oogvolgdata van 40 clinici in VR-simulaties van hartstilstanden om te laten zien hoe situational awareness dynamisch wordt verdeeld over teamrollen en scenariofasen, wat waardevolle inzichten biedt voor gerichte training in acute zorg.

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy PopovThu, 12 Ma💻 cs