cs.CY papers | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Dit paper presenteert een voorlopig verslag over het Artefact Model voor Regelgevende Requirements Engineering (AM4RRE), dat is ontworpen om de integratie van regelgevende compliance in de softwareontwikkelingscyclus te stroomlijnen door de complexiteit van verschillende perspectieven aan te pakken.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

Deze studie toont aan dat frontier-large-language-modellen, met name Claude, politieke standpunten effectiever kunnen beïnvloeden dan traditionele campagnemethoden, waarbij de effectiviteit van informatieve prompts en de prestaties per model sterk variëren.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dit artikel biedt een survey van Computerized Adaptive Testing (CAT) vanuit een machine learning-perspectief, waarbij wordt onderzocht hoe deze technieken de meetmodellen, vraagselectie, bankconstructie en testbeheer kunnen optimaliseren om robuustere, eerlijkere en efficiëntere adaptieve testsystemen te ontwikkelen.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

Dit gemengde methodologische onderzoek analyseert de levensgeschiedenis van Wikipedia-artikelen over taboe-onderwerpen en identificeert zes thema's die aantonen dat dergelijke kennisartefacten gedijen door veerkrachtig leiderschap, betrokken organisaties en emergente governance ondanks conflicten en beperkte identificeerbaarheid.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

Dit paper introduceert Llama-Mob, een instructie-getrainde Llama-3-8B-versie die door middel van vraag-en-antwoordinteracties superieure prestaties levert bij het voorspellen van langdurige menselijke mobiliteit in steden en sterke zero-shot generalisatie toont naar andere steden.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

Dit onderzoek presenteert MediTools, een prototype-toepassing die grote taalmodellen (LLMs) inzet om medisch onderwijs te revolutioneren door interactieve tools te bieden voor het simuleren van klinische scenario's, het analyseren van medische literatuur en het samenvatten van nieuws.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Dit onderzoek toont aan dat het combineren van Large Language Models voor het extraheren van cognitieve en taalkundige kenmerken met boomgebaseerde machine learning-algoritmen een nauwkeuriger methode biedt om de moeilijkheidsgraad van K-5 wiskunde- en leesitems te voorspellen dan directe schattingen door LLM's, waardoor de afhankelijkheid van uitgebreide veldtests kan worden verminderd.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Deze paper introduceert SPOT, het eerste geannoteerde Franse corpus en benchmark voor het detecteren van kritieke ingrepen in online discussies, en toont aan dat fijngefineerde encoder-modellen contextuele metadata effectiever benutten dan geprompte LLM's voor deze taak.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Dit paper introduceert XInsight, een multi-agent framework dat digitale psychologische ondersteuning structureert volgens het 'Exploration-Insight-Action'-paradigma met gespecialiseerde agents voor case-conceptualisering, therapeutische routing en reflectie, en introduceert XInsight-Bench voor transparante evaluatie om de bruikbaarheid van dergelijke systemen voor digitaal welzijn te vergroten.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Deze studie concludeert dat eerdere blootstelling aan targeting de sterkste indicator is voor kwetsbaarheid voor door AI mogelijk gemaakte oplichting onder migranten uit Sub-Sahara-Afrika, terwijl vertrouwen in het kunnen identificeren van AI-inhoud en een hoge verificatie-inspanning beschermende factoren vormen.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

Dit paper introduceert een ethiek-van-ontwerp besturingsarchitectuur die een drievoudige poortstructuur (metrisch, bestuurlijk en ecologisch) implementeert in de volledige AI-levenscyclus om ethische risico's om te zetten in afdwingbare en testbare controles die compatibel zijn met bestaande MLOps-pipelines en regelgeving zoals de EU AI Act.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

Dit paper introduceert DeepScope, een diep-leringsysteem dat microscopische beelden van niet-geïncubeerde watermonsters analyseert om fecale vervuiling binnen seconden met 93% nauwkeurigheid te detecteren, waardoor de testtijd met meer dan 98% wordt verkort en de kosten dalen tot $0,44 per test.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

Dit artikel voorspelt dat voorgestelde federale bezuinigingen op onderzoeksondersteuning onder de Trump-regering in 2026 zullen leiden tot een aanzienlijke toename van de hoeveelheid R1-universiteiten waarbij meer dan de helft van het faculteitspersoneel onvoldoende middelen heeft voor kwalitatief hoogstaand onderzoek, wat de continuïteit van STEAM- en doctoraatsprogramma's in gevaar brengt.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Dit onderzoek toont aan dat auteurs van minderheidsgroepen, vrouwen en onderzoekers uit het Zuiden significant worden benadeeld in academische peer review, wat de dringende noodzaak onderstreept van rechtvaardigheidsinterventies in zowel traditionele als AI-gestuurde beoordelingsprocessen.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Dit hoofdstuk onderzoekt hoe generatieve kunstmatige intelligentie kan fungeren als een katalysator voor coherentie in het onderwijs, de leerprocessen en de beoordeling van wetenschappelijke geletterdheid op K-16+ niveau, terwijl het ook de conceptuele en praktische uitdagingen en de noodzakelijke architectuur voor implementatie belicht.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Deze studie toont aan dat generatieve AI in het ontwerponderwijs vooral fungeert als cognitieve versneller die door studenten wordt ingezet in de vroege fasen van het proces, terwijl menselijke competenties zoals vakinhoudelijke kennis, smaak en oordeelsvermogen essentieel blijven voor het interpreteren, valideren en verfijnen van AI-generaties.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Dit paper introduceert een derde ambitie voor kunstmatige intelligentie naast productiviteit en alignement, namelijk het gebruik van grote taalmodellen als wetenschappelijke instrumenten om menselijk gedrag, cultuur en morele redenering te bestuderen door de in hun training opgenomen symbolische patronen te analyseren.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Deze studie toont aan dat politieke polarisatie op Reddit, in tegenstelling tot op Twitter, wordt gekenmerkt door een verankerde, zelfgeselecteerde kern van gebruikers die niet wordt verzacht door blootstelling aan tegenstrijdige meningen, maar juist wordt versterkt door echo-kamers en overlevingsbias.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Deze studie toont aan dat grote taalmodellen in de Nepalese context aanzienlijke sociale vooroordelen vertonen, waarbij impliciete generatieve bias sterk verschilt van expliciete instemming en een niet-lineair verband vertoont met de temperatuurinstelling, wat de noodzaak benadrukt van cultureel onderbouwde evaluatie- en debiasingstrategieën.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Dit onderzoek analyseert de governance van AI-genererde content op 40 socialemediaplatforms en concludeert dat hoewel de meeste platforms zich richten op moderatie en transparantie, er behoefte is aan meer uitgebreide, toekomstgerichte beleidslijnen en educatie, vooral op het gebied van eigendom en monetarisatie.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← Vorige Volgende →