cs.HC Arbeiten | Gist.Science

Just-In-Time Objectives: A General Approach for Specialized AI Interactions

Die Arbeit stellt einen Ansatz vor, bei dem durch passives Beobachten des Nutzerverhaltens sofortige, spezifische Ziele abgeleitet werden, um große Sprachmodelle dynamisch auf individuelle Aufgaben zu spezialisieren und dadurch qualitativ überlegene, maßgeschneiderte Tools sowie Antworten zu generieren.

Michelle S. Lam, Omar Shaikh, Hallie Xu, Alice Guo, Diyi Yang, Jeffrey Heer, James A. Landay, Michael S. BernsteinMon, 09 Ma🤖 cs.AI

Indicating Robot Vision Capabilities with Augmented Reality

Die Studie schlägt vor, Augmented-Reality-Indikatoren für das Sichtfeld von Robotern zu verwenden, um die mentalen Modelle von Menschen zu korrigieren und die Genauigkeit bei der Mensch-Roboter-Kollaboration zu erhöhen, wobei sich zeigte, dass in den Aufgabenraum projizierte (allozentrische) Indikatoren die beste Genauigkeit bieten.

Hong Wang, Ridhima Phatak, James Ocampo, Zhao HanMon, 09 Ma💻 cs

Safe Autonomous Lane Changing: Planning with Dynamic Risk Fields and Time-Varying Convex Space Generation

Diese Arbeit stellt einen neuartigen Planungsansatz für autonomes Spurwechseln vor, der dynamische Risikofelder mit zeitvariablen konvexen Freiräumen und einem eingeschränkten iLQR-Algorithmus kombiniert, um in komplexen Verkehrsszenarien sichere, effiziente und komfortable Trajektorien zu gewährleisten.

Yijun Lu, Zhihao Lin, Zhen TianMon, 09 Ma💻 cs

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Diese Arbeit stellt XR-DT vor, ein Framework für Extended Reality und Digital Twins, das eine menschenbewusste Modellprädiktive Pfadintegral-Steuerung (HA-MPPI) mit einem Transformer-basierten Vorhersagemodell kombiniert, um sichere und effiziente Navigation von mobilen Robotern in gemeinsamen Arbeitsräumen zu ermöglichen.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian ClaudelMon, 09 Ma🤖 cs.AI

Why Human Guidance Matters in Collaborative Vibe Coding

Die Studie zeigt, dass bei der kollaborativen „Vibe Coding"-Programmierung menschliche Führung durch übergeordnete Anweisungen entscheidend für den Erfolg ist, während rein KI-gesteuerte Ansätze oft scheitern und hybride Modelle am besten funktionieren, wenn Menschen die Anleitung übernehmen und die KI die Evaluierung durchführt.

Haoyu Hu, Raja Marjieh, Katherine M Collins, Chenyi Li, Thomas L. Griffiths, Ilia Sucholutsky, Nori JacobyMon, 09 Ma🤖 cs.AI

From OCR to Analysis: Tracking Correction Provenance in Digital Humanities Pipelines

Die Autoren stellen ein provenienzorientiertes Framework vor, das die Nachvollziehbarkeit von OCR-Korrekturen in digitalen Geisteswissenschaften sicherstellt und nachweist, wie diese Korrekturen die Ergebnisse nachgelagerter NLP-Analysen sowie die wissenschaftliche Interpretation maßgeblich beeinflussen.

Haoze Guo, Ziqi WeiMon, 09 Ma💻 cs

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

Die Studie stellt CLEO vor, ein System, das menschliche und KI-Agenten durch die Echtzeit-Interpretation paralleler Aktionen auf gemeinsamen Artefakten befähigt, dynamisch zwischen Delegation, Steuerung und gleichzeitiger Zusammenarbeit zu wechseln, um so die Grenzen der aktuellen Mensch-Agenten-Kollaboration zu überwinden.

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho KimMon, 09 Ma🤖 cs.AI

XR and Hybrid Data Visualization Spaces for Enhanced Data Analytics

Dieser Beitrag stellt die Vorteile nahtlos integrierter 2D- und 3D-Visualisierungen in Extended-Reality-Umgebungen für die Datenanalyse vor und untermauert diese durch drei Fallstudien.

Santiago Lombeyda, S. G. Djorgovski, Ciro DonalekMon, 09 Ma💻 cs

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Diese Studie leitet aus einer qualitativen Analyse von Chatbot-Entwicklungsdaten und Experteninterviews vier zentrale Themenbereiche ab, um die oft fragmentierte operative Gestaltung von Human-in-the-Loop-Prinzipien im gesamten Lebenszyklus von KI-Anwendungen zu präzisieren.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung PyaeMon, 09 Ma🤖 cs.AI

An Embodied Companion for Visual Storytelling

Die Arbeit stellt „Companion" vor, ein robotisches Zeichensystem, das durch die Integration von Large Language Models und Echtzeit-Interaktion den Menschen wieder in den kreativen Prozess einbindet und so eine synergistische, bidirektionale Zusammenarbeit für das visuelle Geschichtenerzählen ermöglicht, die von Experten als ästhetisch eigenständig und ausstellungsfähig bestätigt wurde.

Patrick Tresset, Markus WulfmeierMon, 09 Ma🤖 cs.AI

Biometric-enabled Personalized Augmentative and Alternative Communications

Diese Studie skizziert einen Fahrplan für die Integration biometrischer Technologien in personalisierte augmentative und alternative Kommunikationssysteme, wobei sie anhand von Fallstudien zu Gesten- und Gebärdenerkennung feststellt, dass die aktuelle KI-Genauigkeit noch nicht den praktischen Anforderungen entspricht, und empfiehlt Maßnahmen zur Schließung dieser Lücke.

S. Yanushkevich, E. Berepiki, P. Ciunkiewicz, V. Shmerko, G. Wolbring, R. GuestMon, 09 Ma💻 cs

The People's Gaze: Co-Designing and Refining Gaze Gestures with General Users and Gaze Interaction Experts

Diese Studie stellt eine zweiphasige Methode vor, bei der durch Co-Design-Workshops mit Laien und anschließende Expertenvalidierung ein intuitives, auf Metaphern und einer kompositionellen Grammatik basierendes Set von 32 Blickgesten entwickelt wurde, um die natürliche Interaktion mit Eye-Tracking-Geräten zu verbessern und das Midas-Touch-Problem zu lösen.

Yaxiong Lei, Xinya Gong, Shijing He, Yafei Wang, Mohamed Khamis, Juan YeMon, 09 Ma💻 cs

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Basierend auf einer Designstudie mit erfahrenen Forschern stellt das Paper ARC vor, ein integriertes System, das durch Multi-Datenbank-Integration, transparente iterative Suche und verifizierbare KI-Unterstützung die kognitive Belastung bei systematischen Literaturübersichten reduziert und Forscher von administrativen Aufgaben hin zu strategischer Exploration befähigt.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael LiutMon, 09 Ma🤖 cs.AI

Enhancing Tool Calling in LLMs with the International Tool Calling Dataset

Die Arbeit stellt den International Tool Calling (ITC)-Datensatz vor, einen groß angelegten, mehrsprachigen Benchmark mit über 3.500 realen APIs aus 40 Ländern, der genutzt wird, um die Leistung und Robustheit von Sprachmodellen bei der Tool-Nutzung in internationalen und nicht-englischen Szenarien zu verbessern.

Zuoyu Zhang, Yancheng ZhuMon, 09 Ma💻 cs

Human-Centered Ambient and Wearable Sensing for Automated Monitoring in Dementia Care: A Scoping Review

Diese Scoping-Review analysiert tragbare und umgebungsbezogene Sensortechnologien zur Überwachung von Menschen mit Demenz und leitet fünf menschenzentrierte Implementierungsprinzipien ab, die auf Personalisierung, Workflow-Integration, Datenschutz sowie ethische und skalierbare Lösungen abzielen.

Mason Kadem, Sarah Masri, Anthea Innes, Rong ZhengMon, 09 Ma💻 cs

CoEditor++: Instruction-based Visual Editing via Cognitive Reasoning

CoEditor++ ist ein trainingsfreies, kognitiv strukturiertes Framework, das durch die Zerlegung von Bildbearbeitungsaufgaben in „was" und „wie" sowie eine selbstreflektierende Auswahlmechanismus state-of-the-art Ergebnisse bei der instruktionsbasierten Bildbearbeitung erzielt und dabei sowohl die visuelle Konsistenz als auch die Interpretierbarkeit verbessert.

Minheng Ni, Yutao Fan, Zhengyuan Yang, Yeli Shen, Yuxiang Wei, Yaowen Zhang, Lijuan Wang, Lei Zhang, Wangmeng ZuoMon, 09 Ma💻 cs

Verify as You Go: An LLM-Powered Browser Extension for Fake News Detection

Die Arbeit stellt Aletheia vor, eine browserbasierte Erweiterung, die mittels Large Language Models und Retrieval-Augmented Generation Fake News nicht nur erkennt, sondern durch evidenzbasierte Erklärungen, einen Diskussionsraum und aktuelle Faktenchecks transparent und nutzerzentriert bekämpft.

Dorsaf Sallami, Esma AïmeurMon, 09 Ma💬 cs.CL

RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks

Die Studie stellt den multimodalen RFM-HRI-Datensatz vor, der menschliche Reaktionen und Wiederherstellungspräferenzen bei Fehlern medizinischer Roboter während der Entnahme von Gegenständen erfasst, um die Grundlage für zuverlässigere Fehlererkennung und -behebung in sicherheitskritischen HRI-Szenarien zu schaffen.

Yashika Batra, Giuliano Pioldi, Promise Ekpo, Arman Sayatqyzy, Purnjay Maruur, Shalom Otieno, Kevin Ching, Angelique TaylorMon, 09 Ma💻 cs

From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises

Der Artikel kritisiert die risikovermeidende Gestaltung aktueller KI-Chatbots im Kontext psychischer Krisen und schlägt stattdessen ein empowerndes Design vor, das KI als unterstützende Brücke zur Deeskalation und Weitervermittlung an professionelle Hilfsangebote nutzt.

Benjamin Kaveladze, Arka Ghosh, Leah Ajmani, Denae Ford, Peter M Gutierrez, Jetta E Hanson, Eugenia Kim, Keertana Namuduri, Theresa Nguyen, Ebele Okoli, Teresa Rexin, Jessica L Schleider, Hongyi Shen, Jina SuhMon, 09 Ma💻 cs

The Fragility Of Moral Judgment In Large Language Models

Die Studie zeigt, dass moralische Urteile von Large Language Models durch narrative Perspektiven und Prompt-Strukturen stark manipuliert werden können, was zu erheblicher Instabilität und Reproduzierbarkeitsproblemen führt, insbesondere bei moralisch mehrdeutigen Fällen.

Tom van Nuenen, Pratik S. SachdevaMon, 09 Ma🤖 cs.AI

← Zurück Weiter →