cs.HC Arbeiten | Gist.Science

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

Das Paper stellt NeuralOS vor, ein neuronales Framework, das mithilfe eines rekurrenten neuronalen Netzwerks und eines diffusionsbasierten Renderers grafische Benutzeroberflächen von Betriebssystemen direkt aus Benutzereingaben simuliert und dabei auch nicht installierte Anwendungen durch synthetische Trainingsdaten nachbilden kann.

Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian DengFri, 13 Ma💬 cs.CL

TRACE: AI-Assisted Assessment of Collaborative Projects in Computer Science Education

Die Studie stellt TRACE vor, ein halbautomatisiertes KI-gestütztes Framework zur fairen und skalierbaren Bewertung individueller Beiträge in kollaborativen Informatik-Projekten durch die Analyse von Repositorys und Kommunikation, das in einer Pilotstudie hohe Übereinstimmung mit Dozentenbewertungen und eine Entlastung des Lehrpersonals zeigte.

Songmei Yu, Andrew ZagulaFri, 13 Ma🤖 cs.AI

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Diese Studie stellt einen agenten XAI-Rahmen vor, der SHAP-Erklärungen durch iterative Verfeinerung mittels multimodaler LLMs verbessert, wobei Experten- und KI-Evaluierungen zeigen, dass die Erklärungsgüte in den ersten Verfeinerungsrunden signifikant steigt, jedoch bei übermäßiger Iteration aufgrund eines Bias-Varianz-Kompromisses wieder abfällt, was die Notwendigkeit eines strategischen Early Stopping für optimale praktische Nutzbarkeit unterstreicht.

Tomoaki Yamaguchi, Yutong Zhou, Masahiro Ryo, Keisuke KatsuraFri, 13 Ma🤖 cs.AI

Learning Through Dialogue: Engagement and Efficacy Matter More Than Explanations

Die Studie zeigt, dass das Lernen durch Large Language Models weniger von der Qualität der Erklärungen abhängt, sondern vielmehr ein interaktives Ergebnis ist, bei dem das kognitive Engagement der Nutzer und deren politische Selbstwirksamkeit entscheidend für Wissens- und Vertrauensgewinne sind.

Shaz Furniturewala, Gerard Christopher Yeo, Kokil JaidkaFri, 13 Ma💬 cs.CL

Do LLMs Truly Benefit from Longer Context in Automatic Post-Editing?

Die Studie zeigt, dass zwar proprietäre Large Language Models mit einfacher Prompting-Strategie nahezu menschliche Qualität beim automatischen Nachbearbeiten von Übersetzungen erreichen, sie jedoch dokumentenbezogene Kontextinformationen kaum nutzen und aufgrund hoher Kosten sowie Latenz für den praktischen Einsatz ungeeignet sind.

Ahrii Kim, Seong-heum KimFri, 13 Ma💬 cs.CL

Evaluating Zero-Shot and One-Shot Adaptation of Small Language Models in Leader-Follower Interaction

Die Studie zeigt, dass feinabgestimmte kleine Sprachmodelle (SLMs) eine effiziente und genaue Lösung für die Echtzeit-Rollenklassifizierung in der Mensch-Roboter-Interaktion darstellen, wobei jedoch eine Leistungsverschlechterung bei One-Shot-Modi aufgrund von Kontextlängenbeschränkungen festgestellt wurde.

Rafael R. Baptista, André de Lima Salgado, Ricardo V. Godoy, Marcelo Becker, Thiago Boaventura, Gustavo J. G. LahrFri, 13 Ma⚡ eess

Exploring Collatz Dynamics with Human-LLM Collaboration

Dieser Artikel untersucht die strukturellen Eigenschaften der Collatz-Iteration durch Phänomene wie modulares Scrambling und eine Burst-Lücken-Zerlegung, leitet daraus theoretische Ergebnisse über die Konvergenz ab und dokumentiert gleichzeitig den kollaborativen Entwicklungsprozess zwischen Mensch und KI.

Edward Y. ChangFri, 13 Ma🔢 math

"I followed what felt right, not what I was told": Autonomy, Coaching, and Recognizing Bias Through AI-Mediated Dialogue

Die Studie zeigt, dass KI-vermittelte Dialoge im Vergleich zum reinen Lesen die Fähigkeit zur Erkennung von Ableismus verbessern, wobei inklusive oder selbstgesteuerte Ansätze ein ausgewogeneres Ergebnis liefern als direkte Voreingenommenheits-Nudges, die zwar die Unterscheidungsfähigkeit schärfen, aber die allgemeine Negativität erhöhen.

Atieh Taheri, Hamza El Alaoui, Patrick Carrington, Jeffrey P. BighamFri, 13 Ma🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

Die Arbeit stellt die „Ghost Framing Theory" vor, die erklärt, wie hybride Ensembles aus Gründern, Investoren und generativer KI durch spezifische rhetorische Affordanzen und iterative Prozesse die Legitimation neuer Unternehmen in einer Ära zunehmend unsichtbarer KI-Nutzung neu definieren.

Greg NyilasyFri, 13 Ma🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Die Studie zeigt, dass das in einer früheren Veröffentlichung berichtete Versagen von KI-Triage-Systemen bei der Erkennung von Notfällen primär auf den unpassenden, prüfungsähnlichen Evaluierungsformaten beruht und nicht auf mangelnden Fähigkeiten der Modelle, da natürlichere Interaktionsformen die Genauigkeit signifikant verbessern.

David Fraile Navarro, Farah Magrabi, Enrico CoieraFri, 13 Ma🤖 cs.AI

Managing Cognitive Bias in Human Labeling Operations for Rare-Event AI: Evidence from a Field Experiment

Eine Feldstudie auf der Plattform DiagnosUs zeigt, dass ein ausgewogenes Feedback, probabilistische Befragung und eine nachgelagerte Kalibrierung kognitive Verzerrungen bei der menschlichen Annotation seltener Ereignisse reduzieren und die Zuverlässigkeit nachgeschalteter KI-Modelle signifikant verbessern.

Gunnar P. Epping, Andrew Caplin, Erik Duhaime, William R. Holmes, Daniel Martin, Jennifer S. TruebloodFri, 13 Ma💰 q-fin

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

Die Studie identifiziert ein neues Versagensmuster namens „Helicoid-Dynamik" in führenden LLMs, bei dem diese unter hohen Risiken zwar Fehler erkennen, aber dennoch in wiederkehrenden, fortschrittlicheren Irrtümern verharren, weil sie bei unüberprüfbaren Entscheidungen Komfort über Zuverlässigkeit stellen.

Alejandro R JadadFri, 13 Ma🤖 cs.AI

A technology-oriented mapping of the language and translation industry: Analysing stakeholder values and their potential implication for translation pedagogy

Diese Studie analysiert auf Basis von Interviews mit Branchenakteuren, wie sich im automatisierten Übersetzungssektor menschlicher und technologischer Wert neu verhandeln, wobei Effizienz zur Basiserwartung wird und Anpassungsfähigkeit als zentrale, vermittelnde Kompetenz für Übersetzer hervortritt.

María Isabel Rivas Ginel, Janiça Hackenbuchner, Alina Secar\u{a}, Ralph Krüger, Caroline RossiFri, 13 Ma💬 cs.CL

From Control to Foresight: Simulation as a New Paradigm for Human-Agent Collaboration

Dieser Perspektivartikel stellt das Paradigma der „Simulation im Loop" vor, das durch das Explorieren simulierter Zukunftsszenarien die menschlich-agnostische Zusammenarbeit von reaktiver Kontrolle zu proaktiver Voraussicht transformiert.

Gaole He, Brian Y. LimFri, 13 Ma💬 cs.CL

Modeling Trial-and-Error Navigation With a Sequential Decision Model of Information Scent

Diese Arbeit erweitert das Konzept des Informationssinns um ein sequenzielles Entscheidungsmodell unter Gedächtnisbeschränkungen, das das trial-and-error-Verhalten von Nutzern bei der Navigation durch vorschnelle Linkauswahl und Rückwärtsbewegungen erklärt.

Xiaofu Jin, Yunpeng Bai, Antti OulasvirtaFri, 13 Ma🤖 cs.LG

An Intent of Collaboration: On Agencies between Designers and Emerging (Intelligent) Technologies

Diese Studie untersucht die Machtverhältnisse zwischen Designern und KI-Systemen wie LLMs und schlägt vor, dass Designer ihre kreative Handlungsfähigkeit durch Selbstreflexion, ein tiefes Verständnis der Technologie und die bewusste Gestaltung der Mensch-Maschine-Beziehung zurückgewinnen können.

Pei-Ying Lin, Julie Heij, Iris Borst, Britt Joosten, Kristina Andersen, Wijnand IJsselsteijnFri, 13 Ma🤖 cs.AI

Human-Centred LLM Privacy Audits: Findings and Frictions

Die Studie stellt mit LMP2 ein browserbasiertes Selbstaudit-Tool vor und identifiziert anhand zweier Nutzerstudien sowie einer Evaluierung verschiedener LLMs sowohl die Fähigkeit von Modellen, personenbezogene Merkmale vorherzusagen, als auch neun zentrale Hindernisse für die Entwicklung zuverlässiger, menschenzentrierter Datenschutzprüfungen im Bereich der generativen KI.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina BerendtFri, 13 Ma💬 cs.CL

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

Die Autoren stellen MHDash, eine Open-Source-Plattform vor, die eine feinkörnige, risikobewusste Evaluierung von KI-Assistenten im Bereich der psychischen Gesundheit ermöglicht und dabei aufzeigt, dass herkömmliche Benchmarks für sicherheitskritische Anwendungen unzureichend sind.

Yihe Zhang, Cheyenne N Mohawk, Kaiying Han + 3 more2026-03-12🤖 cs.AI

A Temporal-Spectral Fusion Transformer with Subject-Specific Adapter for Enhancing RSVP-BCI Decoding

Die vorgestellte Arbeit stellt einen Temporal-Spectral-Fusion-Transformer mit einem subjektspezifischen Adapter (TSformer-SA) vor, der durch die Fusion von zeitlichen und spektralen EEG-Informationen sowie die Nutzung von Vorwissen aus bestehenden Probanden die RSVP-BCI-Decodierungsgenauigkeit auch bei limitierten Trainingsdaten für neue Nutzer signifikant verbessert und die Systembereitstellung beschleunigt.

Xujin Li, Wei Wei, Shuang Qiu + 1 more2026-03-11🤖 cs.AI

ExSampling: a system for the real-time ensemble performance of field-recorded environmental sounds

Die Arbeit stellt ExSampling vor, ein integriertes System aus Aufnahme- und Deep-Learning-Umgebung, das durch automatische Zuordnung von Feldaufnahmen zu Ableton-Live-Spuren die Echtzeit-Performance von Umgebungsgeräuschen sowie die Interaktion zwischen Aufnehmern, Komponisten und Performern ermöglicht.

Atsuya Kobayashi, Reo Anzai, Nao Tokui2026-03-10⚡ eess

← Zurück Weiter →