Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

Questo studio valida un framework basato su Large Language Models per analizzare oltre 16.000 recensioni TripAdvisor, rivelando come tale approccio superi le metriche tradizionali identificando driver critici di insoddisfazione, come la comunicazione e il comportamento dello staff, che hanno portato a un crollo delle valutazioni per EgyptAir nonostante i miglioramenti operativi.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs

A Case Study in Responsible AI-Assisted Video Solutions: Multi-Metric Behavioral Insights in a Public Market Setting

Questo studio presenta un caso di successo sull'uso responsabile dell'IA in un mercato pubblico, dimostrando come sia possibile ottenere approfondimenti comportamentali dettagliati sul flusso e sulla permanenza dei visitatori senza compromettere la privacy, fornendo così dati utili per l'ottimizzazione degli spazi urbani.

Mehrnoush Fereydouni, Eka Ebong, Sahar Maleki + 3 more2026-03-06💻 cs

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

Questo studio meta-analitico rivela che i modelli di linguaggio automatico, in particolare quelli basati su architetture decoder-only, mostrano prestazioni inferiori rispetto agli umani nella valutazione di risposte brevi, con discrepanze significative legate alla difficoltà percepita, alla tokenizzazione e a pregiudizi razziali, suggerendo la necessità di un ripensamento nella progettazione dei sistemi per l'istruzione ad alto rischio.

Michael Hardy2026-03-06💬 cs.CL

Training for Technology: Adoption and Productive Use of Generative AI in Legal Analysis

Uno studio randomizzato su 164 studenti di giurisprudenza dimostra che un breve intervento formativo è fondamentale per aumentare l'adozione e migliorare le prestazioni nell'uso della generazione di intelligenza artificiale (GenAI) per l'analisi legale, mentre il semplice accesso senza formazione non produce benefici e può addirittura ridurre la qualità delle risposte.

Benjamin M. Chen, Hong Bao2026-03-06🤖 cs.AI

Small Changes, Big Impact: Demographic Bias in LLM-Based Hiring Through Subtle Sociocultural Markers in Anonymised Resumes

Questo studio dimostra che, anche dopo la rimozione dei dati identificativi espliciti, i modelli linguistici di grandi dimensioni (LLM) utilizzati per il reclutamento perpetuano pregiudizi demografici basandosi su sottili marcatori socioculturali presenti nei curriculum, favorendo sistematicamente candidati maschi cinesi e caucasici.

Bryan Chen Zhengyu Tan, Shaun Khoo, Bich Ngoc Doan + 3 more2026-03-06💻 cs

The role of spatial scales in assessing urban mobility models

Lo studio valuta sistematicamente le prestazioni dei modelli di mobilità urbana gravitazionale, di radiazione e di visita su diverse scale spaziali, rivelando che sebbene il modello di visita sia generalmente superiore, la scelta della scala e l'uso di cluster basati sulla distanza rispetto ai confini amministrativi influenzano significativamente l'accuratezza e la comprensione della struttura urbana.

Rakhi Manohar Mepparambath, Hoai Nguyen Huynh2026-03-06🔬 physics

Synthetic emotions and consciousness: exploring architectural boundaries

Questo articolo propone un'architettura di controllo emotivo modulare e biologicamente ispirata che, soddisfacendo otto principi progettuali e quattro vincoli di riduzione del rischio (come l'assenza di broadcast globale e metarappresentazione), dimostra la fattibilità di implementare comportamenti simili alle emozioni escludendo deliberatamente le caratteristiche architettoniche associate alla coscienza di accesso, offrendo così un modello teorico e strumenti pratici per la governance e la sicurezza dei sistemi artificiali.

Hermann Borotschnig2026-03-05🤖 cs.AI