cs.CY articoli | Gist.Science

Measuring AI R&D Automation

Questo lavoro propone un insieme di metriche empiriche per monitorare l'automazione della ricerca e sviluppo nell'intelligenza artificiale (AIRDA), al fine di valutarne l'impatto sui progressi tecnologici e sulla sicurezza, colmando così il divario tra i dati esistenti e la comprensione delle reali conseguenze di tale automazione.

Alan Chan, Ranay Padarath, Joe Kwon + 2 more2026-03-06💻 cs

Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

Questo studio valida un framework basato su Large Language Models per analizzare oltre 16.000 recensioni TripAdvisor, rivelando come tale approccio superi le metriche tradizionali identificando driver critici di insoddisfazione, come la comunicazione e il comportamento dello staff, che hanno portato a un crollo delle valutazioni per EgyptAir nonostante i miglioramenti operativi.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs

Invariant Causal Routing for Governing Social Norms in Online Market Economies

Questo articolo propone l'Invarianza Causale di Instradamento (ICR), un quadro di governance che combina il ragionamento controfattuale e la scoperta causale invariante per identificare relazioni stabili tra politiche e norme sociali, consentendo interventi interpretabili ed efficaci nelle economie di mercato online anche in presenza di cambiamenti distributivi.

Xiangning Yu, Qirui Mi, Xiao Xue + 4 more2026-03-06💻 cs

Token Taxes: mitigating AGI's economic risks

Il paper sostiene che l'introduzione di "token taxes", ovvero sovraccarichi sull'uso dei modelli di intelligenza artificiale applicati al punto di vendita, rappresenti una soluzione efficace e attuabile per mitigare i rischi economici dell'AGI, come l'erosione delle basi fiscali e il calo degli standard di vita, sfruttando l'infrastruttura esistente di governance computazionale.

Lucas Irwin, Tung-Yu Wu, Fazl Barez2026-03-06💻 cs

A Case Study in Responsible AI-Assisted Video Solutions: Multi-Metric Behavioral Insights in a Public Market Setting

Questo studio presenta un caso di successo sull'uso responsabile dell'IA in un mercato pubblico, dimostrando come sia possibile ottenere approfondimenti comportamentali dettagliati sul flusso e sulla permanenza dei visitatori senza compromettere la privacy, fornendo così dati utili per l'ottimizzazione degli spazi urbani.

Mehrnoush Fereydouni, Eka Ebong, Sahar Maleki + 3 more2026-03-06💻 cs

Stan: An LLM-based thermodynamics course assistant

Il paper presenta "Stan", un assistente didattico basato su modelli linguistici locali e open-weight per un corso di termodinamica, che supporta simultaneamente studenti e docenti tramite un'unica pipeline di dati, garantendo privacy, costi prevedibili e riproducibilità senza dipendenze da API cloud.

Eric M. Furst, Vasudevan Venkateshwaran2026-03-06🔬 physics

Generalizing Fair Top- $k$ Selection: An Integrative Approach

Questo lavoro generalizza la selezione top- $k$ equa a più gruppi protetti, analizzandone la complessità computazionale e proponendo una soluzione pratica che bilancia l'efficienza, la minimizzazione della disparità rispetto a una funzione di riferimento e la stabilità della funzione di punteggio rispetto alle perturbazioni.

Guangya Cai2026-03-06💻 cs

Analysis of Terms of Service on Social Media Platforms: Consent Challenges and Assessment Metrics

Questo studio analizza i termini di servizio di 13 principali piattaforme social, rivelando attraverso un framework tridimensionale che, sebbene il consenso sia formalmente incluso, la complessità linguistica e la mancanza di trasparenza ne compromettono la chiarezza e la scelta significativa degli utenti.

Yong-Bin Kang, Anthony McCosker2026-03-06💻 cs

Evaluating and Correcting Human Annotation Bias in Dynamic Micro-Expression Recognition

Questo articolo presenta la strategia GAMDSS, un'architettura innovativa che migliora il riconoscimento delle microespressioni dinamiche attraverso la rielaborazione automatica dei fotogrammi chiave, riducendo così i bias di annotazione umana e le incertezze nelle dataset multiculturali senza aumentare la complessità parametrica dei modelli.

Feng Liu, Bingyu Nan, Xuezhong Qian + 1 more2026-03-06💻 cs

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

Questo studio meta-analitico rivela che i modelli di linguaggio automatico, in particolare quelli basati su architetture decoder-only, mostrano prestazioni inferiori rispetto agli umani nella valutazione di risposte brevi, con discrepanze significative legate alla difficoltà percepita, alla tokenizzazione e a pregiudizi razziali, suggerendo la necessità di un ripensamento nella progettazione dei sistemi per l'istruzione ad alto rischio.

Michael Hardy2026-03-06💬 cs.CL

Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness

Questo studio introduce un quadro teorico unificato che dimostra come il rumore necessario per la privacy differenziale nei due strati delle reti neurali comprometta l'apprendimento delle caratteristiche, peggiorando la giustizia, la robustezza e l'efficacia del fine-tuning privato su dati sbilanciati o a coda lunga.

Ruichen Xu, Kexin Chen2026-03-06🤖 cs.LG

Training for Technology: Adoption and Productive Use of Generative AI in Legal Analysis

Uno studio randomizzato su 164 studenti di giurisprudenza dimostra che un breve intervento formativo è fondamentale per aumentare l'adozione e migliorare le prestazioni nell'uso della generazione di intelligenza artificiale (GenAI) per l'analisi legale, mentre il semplice accesso senza formazione non produce benefici e può addirittura ridurre la qualità delle risposte.

Benjamin M. Chen, Hong Bao2026-03-06🤖 cs.AI

Small Changes, Big Impact: Demographic Bias in LLM-Based Hiring Through Subtle Sociocultural Markers in Anonymised Resumes

Questo studio dimostra che, anche dopo la rimozione dei dati identificativi espliciti, i modelli linguistici di grandi dimensioni (LLM) utilizzati per il reclutamento perpetuano pregiudizi demografici basandosi su sottili marcatori socioculturali presenti nei curriculum, favorendo sistematicamente candidati maschi cinesi e caucasici.

Bryan Chen Zhengyu Tan, Shaun Khoo, Bich Ngoc Doan + 3 more2026-03-06💻 cs

Cognitive Warfare: Definition, Framework, and Case Study

Questo articolo propone una definizione unificata e un quadro di interazione basato sul ciclo OODA per la guerra cognitiva, fornendo attributi misurabili e un caso studio applicativo per aiutare i leader delle forze congiunte a valutare le campagne cognitive.

Bonnie Rushing, William Hersch, Shouhuai Xu2026-03-06💻 cs

The role of spatial scales in assessing urban mobility models

Lo studio valuta sistematicamente le prestazioni dei modelli di mobilità urbana gravitazionale, di radiazione e di visita su diverse scale spaziali, rivelando che sebbene il modello di visita sia generalmente superiore, la scelta della scala e l'uso di cluster basati sulla distanza rispetto ai confini amministrativi influenzano significativamente l'accuratezza e la comprensione della struttura urbana.

Rakhi Manohar Mepparambath, Hoai Nguyen Huynh2026-03-06🔬 physics

NL2GDS: LLM-aided interface for Open Source Chip Design

Il paper presenta NL2GDS, un framework innovativo che utilizza modelli linguistici di grandi dimensioni per tradurre descrizioni hardware in linguaggio naturale in layout GDSII completi tramite il flusso OpenLane, dimostrando significativi miglioramenti nell'efficienza di area, ritardo e consumo energetico rispetto ai progetti tradizionali.

Max Eland, Jeyan Thiyagalingam, Dinesh Pamunuwa + 1 more2026-03-06💻 cs

Synthetic emotions and consciousness: exploring architectural boundaries

Questo articolo propone un'architettura di controllo emotivo modulare e biologicamente ispirata che, soddisfacendo otto principi progettuali e quattro vincoli di riduzione del rischio (come l'assenza di broadcast globale e metarappresentazione), dimostra la fattibilità di implementare comportamenti simili alle emozioni escludendo deliberatamente le caratteristiche architettoniche associate alla coscienza di accesso, offrendo così un modello teorico e strumenti pratici per la governance e la sicurezza dei sistemi artificiali.

Hermann Borotschnig2026-03-05🤖 cs.AI

RLVER: Reinforcement Learning with Verifiable Emotion Rewards for Empathetic Agents

Il paper presenta RLVER, un innovativo framework di apprendimento per rinforzo che utilizza ricompense emotive verificabili da utenti simulati per addestrare modelli linguistici a sviluppare un'intelligenza emotiva superiore, migliorando drasticamente le loro capacità empatiche senza compromettere le competenze logiche e matematiche.

Peisong Wang, Ruotian Ma, Bang Zhang + 13 more2026-03-05🤖 cs.AI

Dutch Metaphor Extraction from Cancer Patients' Interviews and Forum Data using LLMs and Human in the Loop

Questo lavoro presenta HealthQuote.NL, un corpus di metafore estratte da dati in lingua olandese di pazienti oncologici utilizzando modelli linguistici avanzati e un approccio con supervisione umana, con l'obiettivo di migliorare la comunicazione sanitaria e l'assistenza personalizzata.

Lifeng Han, David Lindevelt, Sander Puts + 2 more2026-03-05💬 cs.CL

A Systematic Analysis of Biases in Large Language Models

Questo studio analizza sistematicamente i pregiudizi politici, ideologici, geopolitici, linguistici e di genere presenti in quattro ampiamente utilizzati modelli linguistici su larga scala, rivelando che, nonostante i tentativi di allineamento alla neutralità, questi modelli mantengono diverse forme di inclinazione e bias.

Xulang Zhang, Rui Mao, Erik Cambria2026-03-05🤖 cs.AI

← Precedente Successivo →

cs.CY