Towards Autonomous Mathematics Research

In dit artikel wordt Aletheia, een autonoom wiskundig onderzoekssysteem dat door iteratief genereren, verifiëren en reviseren van oplossingen in natuurlijke taal, geïntroduceerd om de overgang van olympiadeproblemen naar professioneel wiskundig onderzoek te maken, waarbij het zowel volledig door AI gegenereerde papers als mens-AI-samenwerkingen demonstreert.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang LuongMon, 09 Ma🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Dit artikel bekritiseert de illusie van een objectieve 'ground truth' in dataannotatie door aan te tonen dat menselijke meningsverschillen vaak ten onrechte als ruis worden behandeld in plaats van als waardevolle signalen, en pleit voor pluralistische annotatie-infrastructuur die culturele diversiteit erkent in plaats van te onderdrukken.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque AhmedMon, 09 Ma🤖 cs.AI

Biometric-enabled Personalized Augmentative and Alternative Communications

Deze studie schetst een routekaart voor het integreren van biometrische technologieën in gepersonaliseerde augmentatieve en alternatieve communicatie (AAC), waarbij wordt geconcludeerd dat de huidige nauwkeurigheid van AI-technieken zoals gebaren- en gebarentaalherkenning nog niet voldoet aan de praktische eisen en aanbevelingen doet om deze kloof te dichten.

S. Yanushkevich, E. Berepiki, P. Ciunkiewicz, V. Shmerko, G. Wolbring, R. GuestMon, 09 Ma💻 cs

From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises

Dit paper pleit voor een verschuiving van risicomijdende naar empowerende ontwerpprincipes voor generatieve AI in mentale crisisinterventies, zodat deze systemen gebruikers niet alleen afwijzen maar fungeren als een ondersteunende brug naar professionele hulp.

Benjamin Kaveladze, Arka Ghosh, Leah Ajmani, Denae Ford, Peter M Gutierrez, Jetta E Hanson, Eugenia Kim, Keertana Namuduri, Theresa Nguyen, Ebele Okoli, Teresa Rexin, Jessica L Schleider, Hongyi Shen, Jina SuhMon, 09 Ma💻 cs

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Deze studie toont aan dat TikTok, ondanks formele naleving van het verbod op profielgebonden reclame voor minderjarigen volgens de Digital Services Act, door een te nauwe definitie van 'reclame' minderjarigen blootstelt aan sterk gepersonaliseerde, vaak ongemarkeerde influencer- en merkcontent die functioneel gelijkwaardig is aan reclame.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

Ambiguity Collapse by LLMs: A Taxonomy of Epistemic Risks

Dit artikel introduceert het concept 'ambiguïteitsinval' waarbij grote taalmodellen complexe, meervoudig interpreteerbare termen reduceren tot een eenduidige betekenis, en presenteert een taxonomie van de epistemische risico's die hieruit voortvloeien op het niveau van proces, output en ecosysteem, met als doel richtlijnen te ontwikkelen voor het behoud en de verantwoorde regeling van ambiguïteit.

Shira Gur-Arieh, Angelina Wang, Sina FazelpourMon, 09 Ma🤖 cs.AI

Measuring Perceptions of Fairness in AI Systems: The Effects of Infra-marginality

Deze studie met 85 deelnemers in een medisch scenario toont aan dat mensen eerlijkheid in AI-systemen niet enkel baseren op statistische uitkomsten, maar sterk beïnvloed worden door hun overtuigingen over de onderliggende oorzaken van verschillen in data-distributies, wat impliceert dat eerlijkheidsdefinities rekening moeten houden met deze context om te aligneren met menselijke verwachtingen.

Schrasing Tong, Minseok Jung, Ilaria Liccardi, Lalana KagalMon, 09 Ma💻 cs

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

SemFuzz is een semantisch bewust fuzzing-framework dat grote taalmodellen gebruikt om regels uit RFC-documenten te extraheren en testgevallen genereert die deze regels bewust schenden, waardoor diepe semantische kwetsbaarheden in netwerkprotocol-implementaties kunnen worden ontdekt die door bestaande methoden vaak worden gemist.

Yanbang Sun, Quan Luo, Yuelin Wang, Qian Chen, Benjin Liu, Ruiqi Chen, Qing Huang, Xiaohong Li, Junjie WangMon, 09 Ma💻 cs