cs.CY articoli | Gist.Science

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Questo articolo propone il "Learning Visibility Framework" per affrontare l'uso improprio dell'IA nell'istruzione non come un problema di rilevamento, ma come una sfida di misurazione legata alla perdita di visibilità sul processo di apprendimento, suggerendo di passare dalla sorveglianza alla trasparenza condivisa tra studenti e docenti.

Eduardo Davalos, Yike ZhangTue, 10 Ma💻 cs

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Attraverso due esperimenti sul campo su GitHub, lo studio dimostra che la manipolazione delle metriche di prova sociale, come le stelle e i download, non ha alcun impatto misurabile sulle successive download o sull'attività degli sviluppatori nei pacchetti software open source.

Lucas Shen, Gaurav SoodTue, 10 Ma💻 cs

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Il paper propone un framework AI modulare che utilizza l'analisi semantica e sintattica delle definizioni SQL per assegnare punteggi di rischio alle metriche aggregate in ambito sanitario, consentendo una governance proattiva della privacy e la condivisione sicura dei dati tra diversi dipartimenti senza accedere a informazioni sensibili.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Questo studio valuta l'efficacia delle revisioni di proposte di sovvenzione basate su LLM attraverso perturbazioni strutturate, rivelando che l'approccio sezione per sezione supera le alternative ma che i sistemi attuali mostrano variabilità e priorità di valutazione disallineate, risultando più adatti al controllo di conformità che alla valutazione olistica.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Questo paper propone una nuova misura di equità chiamata "rischio discriminatorio" che integra aspetti individuali e di gruppo, dimostrando teoricamente come la combinazione di ensemble possa migliorare l'equità dei modelli di machine learning attraverso limiti dipendenti dal margine e introducendo metodi di potatura per ottenere sottogruppi sia accurati che equi.

Yijun BianThu, 12 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Questo studio dimostra che personalizzare le spiegazioni degli suggerimenti generati dall'intelligenza artificiale in un sistema di tutoraggio intelligente, adattandole alle caratteristiche degli studenti con bassi livelli di bisogno di cognizione e coscienziosità, ne aumenta l'interazione, la comprensione e l'apprendimento.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Questo studio analizza l'impatto di Shiksha Copilot, uno strumento di intelligenza artificiale collaborativa per la creazione di piani di lezione, nelle scuole governative del Karnataka, India, evidenziando come esso riduca il carico burocratico e lo stress degli insegnanti promuovendo al contempo una didattica basata sulle attività, pur rimanendo limitato da sfide sistemiche come la carenza di personale.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Questo studio analizza le percezioni di ascoltatori italiani riguardo ai sistemi di raccomandazione musicale, rivelando una mancanza di consapevolezza critica sul funzionamento degli algoritmi e sulle questioni di rappresentazione di genere, e sottolineando la necessità di integrare prospettive psicosociali nella progettazione di sistemi più affidabili e culturalmente sensibili.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

R v F (2025): Addressing the Defence of Hacking

Questo studio di caso su R v F (2025) analizza la difesa dell'hacking ("SODDI") fornendo alle indagini forensi digitali le prime linee guida pratiche ed empiriche per confutare tale argomentazione in tribunale.

Junade AliThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Questa ricerca dimostra che l'ordine di valutazione (prima la recensione o prima il voto) polarizza le recensioni dei consumatori, aumentando i voti estremi per servizi di alta o bassa qualità grazie a euristiche affettive e sforzo cognitivo, un effetto confermato sia da esperimenti controllati che da dati reali di piattaforme come Yelp e Letterboxd.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Nonostante le proteste degli utenti secondo cui i nuovi modelli OpenAI avrebbero perso empatia, uno studio clinico dimostra che i punteggi di empatia sono rimasti invariati tra le generazioni, rivelando invece che la percezione di un calo è dovuta a un cambiamento nella postura di sicurezza: i modelli più recenti hanno migliorato il rilevamento delle crisi ma ridotto la sicurezza dei consigli, creando un compromesso invisibile che gli utenti interpretano erroneamente come una mancanza di empatia.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Questo studio presenta TOBA-LM, un modello linguistico trilingue basato su GPT-2 che integra un meccanismo di memoria Engram adattivo, dimostrando come tale approccio riduca significativamente i requisiti computazionali e acceleri la convergenza rispetto alle architetture transformer convenzionali per le lingue regionali indonesiane come il Batak e il Minangkabau.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

Open Educational Resources: Barriers and Open Issues

Questo studio identifica e valida attraverso interviste con esperti 26 barriere sociali, economiche e tecniche che ostacolano l'adozione delle Risorse Educative Aperte (OER), proponendo un modello concettuale per sviluppare strategie inclusive e politiche pubbliche volte a garantire un accesso universale all'istruzione.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi NakagawaThu, 12 Ma💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

Il documento propone una specifica iniziale per un'API standard e indipendente dalla piattaforma, denominata $\mu$ Ed, volta a creare un ecosistema interoperabile di microservizi educativi per automatizzare funzioni come la valutazione, il feedback e i chatbot didattici, integrando esperienze di quattro istituzioni.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The coordination gap in frontier AI safety policies

Il documento sostiene che le attuali politiche di sicurezza per l'IA avanzata trascurano la capacità istituzionale di coordinare le risposte quando i controlli preventivi falliscono, proponendo l'adozione di meccanismi di pre-impegno, protocolli condivisi e sedi di coordinamento permanenti, tratti da settori come la sicurezza nucleare e la preparazione alle pandemie, per colmare questo divario strutturale.

Isaak MengeshaThu, 12 Ma📈 econ

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Lo studio esamina la presenza di bias cognitivi simili a quelli umani, come l'effetto della vittima virtuosa e l'effetto alone, nei modelli linguistici di grandi dimensioni utilizzati per il supporto alle decisioni giudiziarie, rivelando che, sebbene questi modelli mostrino alcune distorsioni, presentano in generale un pregiudizio inferiore rispetto agli esseri umani, sebbene le variazioni tra i diversi modelli ne limitino attualmente l'uso pratico nei sistemi giudiziari.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

Il documento esamina come il principio di proporzionalità, fondamentale nel diritto dell'UE, possa guidare lo sviluppo di metodi scientifici per calibrare le valutazioni dei rischi sistemici dei modelli di intelligenza artificiale generale, garantendo un equilibrio tra una gestione efficace dei rischi e la riduzione degli oneri per gli innovatori nell'ambito dell'attuazione dell'AI Act.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Il paper presenta DeliberationBench, un benchmark normativo che valuta l'influenza persuasiva dei modelli linguistici di grandi dimensioni (LLM) confrontandola con i sondaggi di opinione deliberativa, dimostrando attraverso un esperimento su larga scala che tali modelli esercitano effetti epistemicamente desiderabili e allineati agli standard democratici.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs

Prompts and Prayers: the Rise of GPTheology

Questo studio interdisciplinare esamina l'emergere della "GPTheologia", un nuovo fenomeno di fede tecnologica in cui l'intelligenza artificiale viene percepita come entità divina, analizzando come le interazioni quotidiane con i modelli linguistici stiano sviluppando rituali e narrazioni che ricalcano strutture religiose tradizionali con profonde implicazioni etiche e sociali.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell VaughanThu, 12 Ma💻 cs

Dark Patterns and Consumer Protection Law for App Makers

Questo articolo esamina come i "dark pattern" nelle app possano compromettere l'autonomia dei consumatori e violare le normative sulla protezione dei consumatori, proponendo strategie di progettazione trasparente per evitare responsabilità legali e costruire fiducia.

Gregory M. DickinsonThu, 12 Ma💻 cs

← Precedente Successivo →

cs.CY