cs.CY articoli | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Questo articolo presenta il modello AM4RRE, un approccio basato su artefatti e prospettive multiple per integrare sistematicamente l'ingegneria dei requisiti normativi nel ciclo di vita dello sviluppo software, al fine di realizzare una conformità "by design" e raccogliere feedback per la fase finale di uno studio dottorale.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Questo studio valuta i rischi di persuasione politica di sette modelli linguistici all'avanguardia attraverso due esperimenti su 19.145 partecipanti, rivelando che questi modelli superano le pubblicità elettorali tradizionali, con Claude che risulta il più persuasivo e Grok il meno, mentre l'efficacia dei prompt basati su informazioni varia significativamente a seconda del modello.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Questo articolo offre una panoramica incentrata sull'apprendimento automatico del Computerized Adaptive Testing (CAT), esaminando come le tecniche di ML possano ottimizzare i modelli di misurazione, la selezione delle domande e il controllo dei test per creare sistemi più robusti, equi ed efficienti rispetto ai metodi psicometrici tradizionali.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

Questo studio misto analizza come gli articoli Wikipedia su argomenti tabù, nonostante i conflitti e la censura, riescano a svilupparsi e sostenersi grazie a leadership resilienti, organizzazioni impegnate e forme emergenti di governance.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

Questo studio presenta Llama-Mob, un modello LLM basato su Llama-3-8B e affinato tramite instruction tuning che supera gli stati dell'arte nella previsione a lungo termine della mobilità urbana e dimostra una forte capacità di generalizzazione zero-shot tra diverse città.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

Il progetto MediTools sfrutta i modelli linguistici di grandi dimensioni per rivoluzionare l'educazione medica attraverso un'applicazione interattiva che include simulazioni di casi clinici, strumenti di analisi della letteratura scientifica e aggiornamenti sulle notizie mediche, validati da un sondaggio tra professionisti e studenti del settore.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Questo studio dimostra che l'uso di modelli linguistici di grandi dimensioni (LLM) per estrarre caratteristiche cognitive e linguistiche, successivamente elaborate da algoritmi di apprendimento automatico basati su alberi decisionali, consente di stimare con maggiore precisione la difficoltà degli item nei test scolastici rispetto alla valutazione diretta, offrendo un'alternativa efficiente e scalabile ai costosi test sul campo.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Il paper introduce SPOT, il primo corpus annotato in francese e benchmark per il rilevamento delle "interruzioni critiche" (stopping points) nei dibattiti online, dimostrando che i modelli encoder finetunati superano significativamente i grandi modelli linguistici in questo compito e fornendo risorse open-source per la ricerca riproducibile.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Il paper presenta XInsight, un framework multi-agente ispirato alla consulenza psicologica che organizza il supporto digitale in un flusso di lavoro coerente con il paradigma Esplorazione-Insight-Azione, integrando agenti specializzati per la concettualizzazione dei casi, il routing terapeutico adattivo e la documentazione strutturata, e introduce XInsight-Bench per una valutazione rigorosa, migliorando significativamente l'allineamento clinico e l'interpretabilità rispetto ai sistemi esistenti.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Questo studio valuta la vulnerabilità dei migranti subsahariani alle truffe abilitate dall'intelligenza artificiale, rivelando che l'esposizione precedente al targeting è il principale fattore di rischio, mentre la capacità di identificare i contenuti AI e l'impegno comportamentale nella verifica agiscono come fattori protettivi significativi.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Questo articolo presenta un'architettura di controllo "ethics-by-design" che integra ragionamenti etici e un sistema a triple cancelli (metrici, di governance e ambientali) in tutte le fasi del ciclo di vita dell'IA, traducendo principi normativi in meccanismi operativi verificabili e integrabili con le pipeline MLOps esistenti.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

Questo articolo presenta DeepScope, un sistema basato sull'intelligenza artificiale che analizza immagini microscopiche di campioni d'acqua non incubati per rilevare la contaminazione fecale in pochi secondi con un costo di 0,44 dollari per test, superando così i requisiti di velocità e accessibilità degli attuali metodi di sicurezza idrica.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

Il documento analizza come i previsti tagli federali alla ricerca del 2026 potrebbero ridurre drasticamente il finanziamento medio dei docenti nelle università statunitensi, portando a un "inverno dell'innovazione" che minaccerebbe la sostenibilità dei programmi di ricerca e dottorato, specialmente nelle discipline STEMM.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Questo studio utilizza un'analisi causale su un dataset di 530 articoli per dimostrare che razza, genere e provenienza geografica degli autori influenzano significativamente e negativamente le valutazioni di accettazione nella revisione paritaria, evidenziando la necessità urgente di interventi di equità nei processi di valutazione accademica tradizionali e basati sull'intelligenza artificiale.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Questo capitolo esamina il potenziale dell'intelligenza artificiale generativa per migliorare l'alfabetizzazione scientifica nel percorso K-16+, proponendo un'architettura che garantisca coerenza tra insegnamento, apprendimento e valutazione delle conoscenze e del ragionamento scientifico, pur affrontando le sfide concettuali e pratiche di tale integrazione.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Questo studio dimostra che, nell'educazione al design, l'intelligenza artificiale generativa funge principalmente da acceleratore cognitivo nelle fasi iniziali, mentre le competenze umane fondamentali come l'agenzia, la conoscenza di dominio, l'immaginazione e il gusto rimangono essenziali per interpretare il contesto, validare i risultati e affinare le soluzioni creative.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Questo articolo propone una "terza ambizione" per l'intelligenza artificiale, che vede i grandi modelli linguistici non solo come strumenti di produttività o di allineamento, ma come nuovi strumenti scientifici per studiare la cultura, il comportamento umano e il ragionamento morale attraverso l'analisi delle regolarità simboliche apprese dai dati testuali.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Questo studio analizza la polarizzazione politica su Reddit attraverso il caso di studio di r/Brexit, rivelando come la selezione degli utenti e le camere dell'eco portino a opinioni radicalmente radicate piuttosto che a un ammorbidimento dovuto all'esposizione a punti di vista contrastanti.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Questo studio valuta i pregiudizi sociali in sette modelli linguistici di grandi dimensioni all'interno del contesto culturale nepalese, rivelando che le metriche di accordo esplicito non catturano adeguatamente i bias generativi impliciti e sottolineando la necessità di dataset culturalmente fondati per le società sottorappresentate.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Lo studio analizza i quadri di governance di 40 piattaforme social per i contenuti generati dall'IA, rilevando che la maggior parte si concentra sulla moderazione e sulla divulgazione, mentre poche affrontano questioni come la proprietà e la monetizzazione, suggerendo la necessità di normative più complete e strumenti educativi.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← Precedente Successivo →