cs.CY Arbeiten | Gist.Science

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Der Artikel argumentiert, dass der Missbrauch von KI im Bildungswesen weniger ein Detektions- als vielmehr ein Messproblem darstellt, und schlägt das „Learning Visibility Framework" vor, das durch transparente Prozessnachweise und klare Regeln für den KI-Einsatz anstelle von Überwachungstools ethische Integrität und Vertrauen zwischen Lehrenden und Lernenden wiederherstellt.

Eduardo Davalos, Yike ZhangTue, 10 Ma💻 cs

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Die Studie zeigt durch zwei Feldexperimente auf GitHub, dass das Manipulieren von Social-Metric-Kennzahlen wie Sternen oder Download-Zahlen keinen messbaren Einfluss auf die tatsächlichen Downloads oder die Entwickleraktivität bei Open-Source-Paketen hat.

Lucas Shen, Gaurav SoodTue, 10 Ma💻 cs

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Die vorgestellte Arbeit stellt einen KI-gestützten Rahmen vor, der mittels semantischer und syntaktischer Analyse von SQL-Abfragen aggregierte Gesundheitsmetriken auf Datenschutzrisiken bewertet, um eine präventive Governance und sichere datengetriebene Entscheidungsfindung in Gesundheitseinrichtungen zu gewährleisten.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Diese Studie untersucht die Eignung von LLMs für die Begutachtung von EPSRC-Förderanträgen durch strukturierte Perturbationen und stellt fest, dass zwar ein abschnittsbasierter Ansatz die beste Leistung zeigt, die Modelle jedoch eine hohe Variabilität aufweisen und sich zu stark auf Compliance-Checks statt auf eine ganzheitliche Bewertung konzentrieren.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Die Arbeit schlägt eine neue Fairness-Metrik namens „diskriminatives Risiko" vor, die sowohl Gruppen- als auch individuelle Fairness abdeckt, und leitet marginabhängige theoretische Schranken her, die zeigen, dass Ensemble-Methoden die Fairness verbessern können, was durch vorgeschlagene Pruning-Verfahren und umfassende Experimente bestätigt wird.

Yijun BianThu, 12 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Die Studie zeigt, dass die Personalisierung von Erklärungen zu KI-gestützten Hinweisen in intelligenten Tutorensystemen speziell für Lernende mit geringer kognitiver Motivation und Gewissenhaftigkeit deren Interaktion, Verständnis und Lernerfolg signifikant steigert.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Die Studie untersucht „Shiksha Copilot", ein KI-gestütztes Werkzeug zur Erstellung von Unterrichtsplänen in indischen Regierungsschulen, und zeigt, wie die Zusammenarbeit zwischen Lehrkräften und KI administrative Lasten reduziert und die pädagogische Praxis fördert, obwohl systemische Herausforderungen tiefgreifende Veränderungen begrenzen.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Diese Studie analysiert Interviews mit italienischen Musiknutzern, um psychosoziale Perspektiven auf die Wirkung von Empfehlungssystemen zu beleuchten, und stellt fest, dass trotz routinierter Nutzung oft ein kritisches Verständnis der Algorithmen sowie ein Bewusstsein für geschlechtsspezifische Repräsentationsprobleme fehlt, was die Notwendigkeit einer stärkeren Integration psychosozialer Erkenntnisse in die Systemgestaltung unterstreicht.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

R v F (2025): Addressing the Defence of Hacking

Diese Fallstudie zu R v F (2025) beleuchtet, wie digitale Forensiker die „Hacking-Verteidigung" durch empirische Beweise und praktische Techniken entkräften können, um die Justiz bei der Unterscheidung zwischen Unschuldigen und Schuldigen zu unterstützen.

Junade AliThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Die Studie zeigt, dass die Reihenfolge der Bewertung (zunächst Sterne oder Text) die Urteilsbildung von Verbrauchern durch affektive Heuristiken und kognitiven Aufwand polarisiert, wobei dieser Effekt je nach Servicequalität und Produktart variiert und durch große Datenanalysen von Yelp und Letterboxd bestätigt wird.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Die Studie widerlegt die Behauptung, dass neuere GPT-Modelle Empathie verloren haben, und zeigt stattdessen, dass sich die wahrgenommene Veränderung auf eine verschärfte Sicherheitsausrichtung zurückführen lässt, die zwar die Krisenerkennung verbessert, aber gleichzeitig zu einer Verschlechterung der Beratungssicherheit führt.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Die Studie stellt TOBA-LM vor, ein dreisprachiges Sprachmodell auf GPT-2-Basis, das durch die Integration eines adaptiven Engramm-Gedächtnisses die Trainingszeit für indonesische, batakische und minangkabauische Sprachen im Vergleich zu herkömmlichen Transformer-Architekturen erheblich verkürzt und dabei die Rechenanforderungen für ressourcenlimitierte Regionalsprachen senkt.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

Open Educational Resources: Barriers and Open Issues

Diese Studie identifiziert und bewertet 26 soziale, wirtschaftliche und technische Barrieren für Open Educational Resources (OER) durch eine systematische Literaturrecherche und Experteninterviews, um Strategien für einen inklusiveren und nachhaltigeren Zugang zu Bildungsmaterialien zu entwickeln.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi NakagawaThu, 12 Ma💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

Die Arbeit stellt eine erste Spezifikation für eine plattformunabhängige Standard-API namens $\mu$ Ed vor, die durch die Integration bestehender Funktionen an vier Institutionen ein interoperables Ökosystem aus EdTech-Mikrodiensten für Aufgaben wie Feedback, Bewertung und Chatbots ermöglicht, um das Lernen in verschiedenen Disziplinen zu automatisieren und zu bereichern.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The coordination gap in frontier AI safety policies

Der Artikel argumentiert, dass die aktuelle Politik zur Sicherheit von KI an der Spitze den strukturellen Koordinationsmangel bei der Bewältigung von Versagensfällen ignoriert und schlägt vor, bewährte Mechanismen aus Bereichen wie der Nuklearsicherheit und der Pandemieprävention anzupassen, um diese Lücke zu schließen.

Isaak MengeshaThu, 12 Ma📈 econ

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Diese Studie untersucht, ob große Sprachmodelle menschliche kognitive Verzerrungen wie den „virtuous victim"-Effekt und Prestige-Halo-Effekte aufweisen, und stellt fest, dass diese Modelle zwar im Vergleich zu Menschen leicht reduzierte Halo-Effekte zeigen, jedoch aufgrund von Modellvariationen und fehlender statistischer Signifikanz bei bestimmten Faktoren derzeit noch nicht für die richterliche Entscheidungsunterstützung geeignet sind.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

Der Artikel untersucht, wie das im EU-Recht verankerte Prinzip der Verhältnismäßigkeit genutzt werden kann, um wissenschaftliche Methoden für die Risikobewertung von allgemeinen KI-Modellen zu entwickeln, die sowohl aussagekräftige Sicherheitsdaten liefern als auch die Innovationsfähigkeit der Anbieter durch übermäßige Belastungen nicht gefährden.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Die Studie stellt DeliberationBench vor, einen normativen Benchmark, der die Beeinflussung von Nutzern durch große Sprachmodelle anhand deliberativer Meinungsumfragen bewertet und zeigt, dass diese Modelle in einem randomisierten Experiment mit über 4.000 Teilnehmern einen signifikanten, demokratisch legitimen und epistemisch wünschenswerten Einfluss auf die Meinungsbildung ausüben.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs

Prompts and Prayers: the Rise of GPTheology

Diese Studie untersucht das Aufkommen der „GPTheologie" als Form der Techno-Religion, bei der KI-Modelle wie ChatGPT als orakelartige, halb-göttliche Wesen verehrt werden, und analysiert anhand von Online-Community-Diskursen und globalen Projekten, wie sich narrative, rituelle und ethische Dimensionen traditioneller Religionen mit künstlicher Intelligenz vermischen.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell VaughanThu, 12 Ma💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Dieser Artikel untersucht, wie App-Entwickler durch transparente Designprinzipien und die Vermeidung irreführender Schnittstellen („Dark Patterns") sowohl die Nutzerautonomie schützen als auch die Einhaltung des Verbraucherschutzrechts gewährleisten können.

Gregory M. DickinsonThu, 12 Ma💻 cs

← Zurück Weiter →

cs.CY