Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots

Diese Arbeit stellt ein datenschutzfreundliches Vision-Language-Framework für medizinische Dolmetscherroboter vor, das auf lokal eingesetzten Open-Source-LLMs basiert, um sprachliche Handlungen zu erkennen und menschenähnliche Gesten zu generieren, wobei ein neuartiger klinischer Datensatz und eine hohe Genauigkeit von 0,90 die Wirksamkeit des Ansatzes belegen.

Thanh-Tung Ngo, Emma Murphy, Robert J. RossMon, 09 Ma💻 cs

Balancing Domestic and Global Perspectives: Evaluating Dual-Calibration and LLM-Generated Nudges for Diverse News Recommendation

Diese Studie zeigt, dass ein personalisierter Diversitäts-Nudge-Framework mit einem dualen Kalibrierungsalgorithmus die Vielfalt des Nachrichtenkonsums (inländisch und global) bei US-Nutzern erfolgreich steigern kann, wobei die Relevanz zu vorher gelesenen Artikeln ein stärkerer Klick-Prädiktor ist als generische Themen und langfristige Exposition zu einer Präferenz für ausgewogene Nachrichten führt.

Ruixuan Sun, Matthew Zent, Minzhu Zhao, Thanmayee Boyapati, Xinyi Li, Joseph A. KonstanMon, 09 Ma🤖 cs.AI

A Closed-Loop CPR Training Glove with Integrated Tactile Sensing and Haptic Feedback

Diese Arbeit stellt einen geschlossenen Regelkreis-Trainingshandschuh für die Wiederbelebung vor, der über ein hochauflösendes taktiles Sensorarray und haptisches Feedback eine selbstgesteuerte, visuelle Ablenkung minimierende CPR-Übung mit über 92 % Genauigkeit bei der Kraftschätzung ermöglicht.

Jaeyoung Moon, Mingzhuo Ma, Qifeng Yang, Youjin Choi, Seokhyun Hwang, Samuel Burden, Kyung-Joong Kim, Yiyue LuoMon, 09 Ma💻 cs

Lexara: A User-Centered Toolkit for Evaluating Large Language Models for Conversational Visual Analytics

Das Paper stellt Lexara vor, ein benutzerzentriertes Toolkit zur Evaluierung von Large Language Models für konversationelle visuelle Analysen, das auf Interviews mit Entwicklern und Nutzern basiert und realistische Testfälle sowie interpretierbare Metriken für die Bewertung von Visualisierungs- und Sprachqualität ohne Programmierkenntnisse bereitstellt.

Srishti Palani, Vidya SetlurMon, 09 Ma🤖 cs.AI

Glass Chirolytics: Reciprocal Compositing and Shared Gestural Control for Face-to-Face Collaborative Visualization at a Distance

Diese Arbeit stellt „Glass Chirolytics" vor, ein System zur reziproken Überlagerung von Visualisierungen auf Videokonferenzbildern, das es zwei Personen ermöglicht, durch bimanuelle Gesten gemeinsam mit Daten zu interagieren und dabei das Gefühl von Präsenz sowie das gegenseitige Verständnis analytischer Absichten zu stärken.

Dion Barja, Matthew BrehmerMon, 09 Ma💻 cs

Challenges in Synchronous & Remote Collaboration Around Visualization

Dieses Papier charakterisiert 16 Herausforderungen für die synchrone und remote Zusammenarbeit im Bereich der Visualisierung, die auf den Perspektiven von 29 internationalen Experten basieren und sich um fünf kollaborative Aktivitäten sowie die Auswirkungen von XR und KI drehen, um als Rahmen für zukünftige Forschung in den Bereichen Technologie, soziale Faktoren, KI-Unterstützung und Evaluation zu dienen.

Matthew Brehmer, Maxime Cordeil, Christophe Hurter, Takayuki Itoh, Wolfgang Büschel, Mahmood Jasim, Arnaud Prouzeau, David Saffo, Lyn Bartram, Sheelagh Carpendale, Chen Zhu-Tian, Andrew Cunningham, Tim Dwyer, Samuel Huron, Masahiko Itoh, Alark Joshi, Kiyoshi Kiyokawa, Hideaki Kuzuoka, Bongshin Lee, Gabriela Molina León, Harald Reiterer, Bektur Ryskeldiev, Jonathan Schwabish, Brian A. Smith, Yasuyuki Sumi, Ryo Suzuki, Anthony Tang, Yalong Yang, Jian ZhaoMon, 09 Ma💻 cs

Learning Next Action Predictors from Human-Computer Interaction

Die Arbeit stellt LongNAP vor, ein neues Modell zur Vorhersage des nächsten Nutzerhandels, das durch die Analyse multimodaler Interaktionsdaten und die Kombination von parametrischem Lernen mit In-Context-Learning aus langen Historien signifikant bessere Ergebnisse erzielt als bestehende Methoden.

Omar Shaikh, Valentin Teutschbein, Kanishk Gandhi, Yikun Chi, Nick Haber, Thomas Robinson, Nilam Ram, Byron Reeves, Sherry Yang, Michael S. Bernstein, Diyi YangMon, 09 Ma💬 cs.CL

Who We Are, Where We Are: Mental Health at the Intersection of Person, Situation, and Large Language Models

Diese Studie entwickelt interpretierbare Modelle, die psychologische Theorien über die Interaktion von Person und Situation mit Sprachdaten kombinieren, um das dynamische Wohlbefinden in sozialen Medien präziser und nachvollziehbarer zu erfassen als rein embedding-basierte Ansätze.

Nikita Soni, August Håkan Nilsson, Syeda Mahwish, Vasudha Varadarajan, H. Andrew Schwartz, Ryan L. BoydMon, 09 Ma🤖 cs.AI

Hierarchical Resource Rationality Explains Human Reading Behavior

Die Studie schlägt vor, dass das menschliche Leseverhalten durch eine hierarchische ressourcenrationale Optimierung gesteuert wird, bei der Augenbewegungen so ausgewählt werden, dass das Verständnis maximiert und kognitive sowie zeitliche Kosten minimiert werden, wodurch eine einheitliche Erklärung für die Koordination von Wahrnehmung, Gedächtnis und Handlung bei komplexen kognitiven Fähigkeiten geliefert wird.

Yunpeng Bai, Xiaofu Jin, Shengdong Zhao, Antti OulasvirtaMon, 09 Ma💻 cs

Is it Me? Toward Self-Extension to AI Avatars in Virtual Reality

Die Arbeit stellt „ProxyMe", einen VR-Prototypen vor, der durch die Kombination von Avatar-Embodiment, Sprachklonierung und KI-gestützter Sprachmodifikation das Konzept der Selbst-Erweiterung auf KI-Avatare erforscht, um zu untersuchen, wie sich verändernde Grade der Delegation und Steuerbarkeit auf wahrgenommene Handlungsfähigkeit, Urheberschaft und Selbstidentifikation auswirken.

Jieying Zhang, Steeven Villa, Abdallah El AliMon, 09 Ma💻 cs

Exploring Socially Assistive Peer Mediation Robots for Teaching Conflict Resolution to Elementary School Students

Die Studie untersucht die Wirksamkeit sozial assistierender Roboter als Peer-Mediatoren für Konfliktlösungstraining bei Grundschülern und zeigt trotz fehlender statistischer Unterschiede zwischen Roboter- und Tablet-Bedingungen vielversprechende positive Rückmeldungen sowie signifikante Korrelationen zwischen Persönlichkeitsmerkmalen und Lernerfolgen in der Roboterbedingung.

Kaleen Shrestha, Harish Dukkipati, Avni Hulyalkar, Kyla Penamante, Ankita Samanta, Maja MataricMon, 09 Ma💻 cs

Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions

Eine vierwöchige Feldstudie mit 54 Teilnehmern zeigt, dass zwar LLM-basierte Gesundheitsinterventionen als hilfreicher empfunden werden als vordefinierte Vorlagen, die zusätzliche Optimierung durch Contextual Bandits jedoch keinen signifikanten Mehrwert bot, da die wahrgenommene Nützlichkeit primär vom kontextuellen Eingehen auf Nutzerfeedback und nicht von der systematischen Exploration verschiedener Verhaltensänderungstechniken abhing.

Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. SmeddinckMon, 09 Ma🤖 cs.AI