cs.CY papers | Gist.Science

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

Dit artikel onthult hoe een 'kwaadaardig technisch ecosysteem' van open-source tools en software de huidige AI-governance, zoals de NIST-standaarden, ondermijnt door het creëren van niet-toegestane AI-genereren van intieme beelden van volwassenen mogelijk te maken zonder effectieve regulering.

Michelle L. Ding, Harini SureshMon, 09 Ma🤖 cs.AI

AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference

Dit paper introduceert AdAEM, een adaptief en zelfuitbreidend algoritme dat automatisch gecontesteerde testvragen genereert door de interne waarden Grenzen van diverse taalmodellen te onderzoeken, waardoor onderscheidend inzicht in hun waardenverschillen en uitlijning mogelijk wordt.

Jing Yao, Shitong Duan, Xiaoyuan Yi, Dongkuan Xu, Peng Zhang, Tun Lu, Ning Gu, Zhicheng Dou, Xing XieMon, 09 Ma🤖 cs.AI

Bridging MOOCs, Smart Teaching, and AI: A Decade of Evolution Toward a Unified Pedagogy

Dit artikel presenteert een unificerend onderwijskader dat MOOCs, slimme onderwijsmethoden en AI integreert via drie complementaire dimensies om de pedagogische effectiviteit te maximaliseren.

Bo Yuan, Jiazi HuMon, 09 Ma🤖 cs.AI

Classroom AI: Large Language Models as Grade-Specific Teachers

Dit paper introduceert een framework voor het finetunen van Large Language Models om op maat gemaakte, leeftijdsadequate educatieve content te genereren voor zes verschillende onderwijsniveaus, wat leidt tot een aanzienlijke verbetering in de graadovereenkomst zonder in te leveren op feitelijke juistheid.

Jio Oh, Steven Euijong Whang, James Evans, Jindong WangMon, 09 Ma🤖 cs.AI

Towards Autonomous Mathematics Research

In dit artikel wordt Aletheia, een autonoom wiskundig onderzoekssysteem dat door iteratief genereren, verifiëren en reviseren van oplossingen in natuurlijke taal, geïntroduceerd om de overgang van olympiadeproblemen naar professioneel wiskundig onderzoek te maken, waarbij het zowel volledig door AI gegenereerde papers als mens-AI-samenwerkingen demonstreert.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang LuongMon, 09 Ma🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Dit artikel bekritiseert de illusie van een objectieve 'ground truth' in dataannotatie door aan te tonen dat menselijke meningsverschillen vaak ten onrechte als ruis worden behandeld in plaats van als waardevolle signalen, en pleit voor pluralistische annotatie-infrastructuur die culturele diversiteit erkent in plaats van te onderdrukken.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque AhmedMon, 09 Ma🤖 cs.AI

Operational Agency: A Permeable Legal Fiction for Tracing Culpability in AI Systems

Dit artikel introduceert het concept van Operationeel Agentschap en de bijbehorende Operationele Agentschapsgrafiek als een doorlatend juridisch fictief kader dat het mogelijk maakt om aansprakelijkheid voor autonome AI-systemen toe te schrijven aan menselijke actoren en organisaties zonder hen rechtspersoonlijkheid te verlenen.

Anirban Mukherjee, Hannah Hanwen ChangMon, 09 Ma💻 cs

AI Researchers' Views on Automating AI R&D and Intelligence Explosions

Een studie onder 25 toonaangevende AI-onderzoekers uit augustus en september 2025 toont aan dat hoewel er consensus bestaat over het potentieel van AI om zichzelf te automatiseren en een explosieve groei te veroorzaken, er grote onenigheid bestaat over de tijdslijnen, de mate van scepticisme tussen academici en lab-onderzoekers, en de beste governance-maatregelen.

Severin Field, Raymond Douglas, David KruegerMon, 09 Ma💻 cs

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Dit empirische onderzoek, gebaseerd op een kwalitatieve analyse van een chatbot-studie en interviews met experts, identificeert vier thema's rond menselijke autoriteit, iteratieve verfijning, operationele beperkingen en samenwerking om de ontwikkeling van Human-in-the-Loop AI-systemen te verbeteren.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung PyaeMon, 09 Ma🤖 cs.AI

Biometric-enabled Personalized Augmentative and Alternative Communications

Deze studie schetst een routekaart voor het integreren van biometrische technologieën in gepersonaliseerde augmentatieve en alternatieve communicatie (AAC), waarbij wordt geconcludeerd dat de huidige nauwkeurigheid van AI-technieken zoals gebaren- en gebarentaalherkenning nog niet voldoet aan de praktische eisen en aanbevelingen doet om deze kloof te dichten.

S. Yanushkevich, E. Berepiki, P. Ciunkiewicz, V. Shmerko, G. Wolbring, R. GuestMon, 09 Ma💻 cs

From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises

Dit paper pleit voor een verschuiving van risicomijdende naar empowerende ontwerpprincipes voor generatieve AI in mentale crisisinterventies, zodat deze systemen gebruikers niet alleen afwijzen maar fungeren als een ondersteunende brug naar professionele hulp.

Benjamin Kaveladze, Arka Ghosh, Leah Ajmani, Denae Ford, Peter M Gutierrez, Jetta E Hanson, Eugenia Kim, Keertana Namuduri, Theresa Nguyen, Ebele Okoli, Teresa Rexin, Jessica L Schleider, Hongyi Shen, Jina SuhMon, 09 Ma💻 cs

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Deze studie toont aan dat TikTok, ondanks formele naleving van het verbod op profielgebonden reclame voor minderjarigen volgens de Digital Services Act, door een te nauwe definitie van 'reclame' minderjarigen blootstelt aan sterk gepersonaliseerde, vaak ongemarkeerde influencer- en merkcontent die functioneel gelijkwaardig is aan reclame.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Ambiguity Collapse by LLMs: A Taxonomy of Epistemic Risks

Dit artikel introduceert het concept 'ambiguïteitsinval' waarbij grote taalmodellen complexe, meervoudig interpreteerbare termen reduceren tot een eenduidige betekenis, en presenteert een taxonomie van de epistemische risico's die hieruit voortvloeien op het niveau van proces, output en ecosysteem, met als doel richtlijnen te ontwikkelen voor het behoud en de verantwoorde regeling van ambiguïteit.

Shira Gur-Arieh, Angelina Wang, Sina FazelpourMon, 09 Ma🤖 cs.AI

The Values of Value in AI Adoption: Rethinking Efficiency in UX Designers' Workplaces

Dit onderzoek, gebaseerd op workshops met UX-designers, toont aan dat AI-adoptie niet alleen een kwestie van efficiency is, maar een proces van onderhandeling over waarden zoals verantwoordelijkheid, vertrouwen en autonomie dat de rollen en machtsverhoudingen binnen teams herdefinieert.

Inha Cha, Catherine Wieczorek, Richmond Y. WongMon, 09 Ma💻 cs

Measuring Perceptions of Fairness in AI Systems: The Effects of Infra-marginality

Deze studie met 85 deelnemers in een medisch scenario toont aan dat mensen eerlijkheid in AI-systemen niet enkel baseren op statistische uitkomsten, maar sterk beïnvloed worden door hun overtuigingen over de onderliggende oorzaken van verschillen in data-distributies, wat impliceert dat eerlijkheidsdefinities rekening moeten houden met deze context om te aligneren met menselijke verwachtingen.

Schrasing Tong, Minseok Jung, Ilaria Liccardi, Lalana KagalMon, 09 Ma💻 cs

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Dit paper introduceert THETA, een open-source framework dat domein-geadaptede embeddings en een AI-wetenschapsagent combineert om kwalitatief sociaal wetenschappelijk onderzoek schaalbaar te maken zonder in te boeten aan semantische diepgang of theoretische rigor.

Zhenke Duan, Xin LiMon, 09 Ma💻 cs

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

SemFuzz is een semantisch bewust fuzzing-framework dat grote taalmodellen gebruikt om regels uit RFC-documenten te extraheren en testgevallen genereert die deze regels bewust schenden, waardoor diepe semantische kwetsbaarheden in netwerkprotocol-implementaties kunnen worden ontdekt die door bestaande methoden vaak worden gemist.

Yanbang Sun, Quan Luo, Yuelin Wang, Qian Chen, Benjin Liu, Ruiqi Chen, Qing Huang, Xiaohong Li, Junjie WangMon, 09 Ma💻 cs

What are AI researchers worried about?

Een grootschalig onderzoek onder meer dan 4.000 AI-onderzoekers onthult dat hun zorgen over de technologie, met name de beperkte aandacht voor existentiële risico's, sterk afwijken van de publieke en mediadiscours en eerder overeenkomen met de bestaande maatschappelijke bezorgdheid over reële sociotechnische risico's.

Cian O'Donovan, Sarp Gurakan, Ananya Karanam, Xiaomeng Wu, Jack StilgoeMon, 09 Ma💻 cs

Human, Algorithm, or Both? Gender Bias in Human-Augmented Recruiting

Deze studie toont aan dat hoewel menselijke recruiters genderbias beter vermijden dan AI alleen, een hybride aanpak waarbij recruiters eerst door AI aanbevolen kandidaten bekijken en daarna zelf zoeken, de meest eerlijke selectie oplevert.

Mesut Kaya, Toine BogersMon, 09 Ma💻 cs

Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion

Dit onderzoek onthult dat grote taalmodellen, ondanks algemene overeenstemming met maatschappelijke opinies, systematisch falen in het accuraat weergeven van religieuze perspectieven en minderheidsgroepen in Azië, waardoor ze vaak negatieve stereotypen versterken ondanks lichte mitigatie-inspanningen.

Hari Shankar, Vedanta S P, Sriharini Margapuri, Debjani Mazumder, Ponnurangam Kumaraguru, Abhijnan ChakrabortyMon, 09 Ma💬 cs.CL

← Vorige Volgende →