The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

En adoptant une approche centrée sur les survivants, cette étude expose l'écosystème technique malveillant facilitant la création d'images intimes non consensuelles générées par l'IA et démontre l'inefficacité des cadres de gouvernance actuels, tels que le rapport NIST AI 100-4, pour réguler ce phénomène.

Michelle L. Ding, Harini SureshMon, 09 Ma🤖 cs.AI

Towards Autonomous Mathematics Research

Ce travail présente Aletheia, un agent de recherche mathématique autonome capable de générer, vérifier et réviser des solutions de bout en bout, démontrant ainsi des avancées significatives allant de la résolution de problèmes olympiques à la production de résultats de recherche doctorale et à la collaboration humain-IA.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang LuongMon, 09 Ma🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Cet article critique l'illusion positiviste du « ground truth » en montrant comment les pratiques d'annotation actuelles étouffent la subjectivité humaine au profit d'un consensus artificiel, et propose de réhabiliter le désaccord comme un signal essentiel pour construire des modèles culturellement compétents.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque AhmedMon, 09 Ma🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Cette étude empirique identifie quatre thèmes clés concernant la gouvernance, l'amélioration itérative, les contraintes opérationnelles et la collaboration dans le développement d'applications d'IA intégrant l'humain, afin de combler le manque de guidance opérationnelle pour structurer les rôles et les mécanismes de contrôle.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung PyaeMon, 09 Ma🤖 cs.AI

Biometric-enabled Personalized Augmentative and Alternative Communications

Cette étude propose une feuille de route pour intégrer les technologies biométriques aux systèmes de communication alternative et augmentative (CAA) personnalisés, en identifiant les lacunes actuelles de la reconnaissance gestuelle et en langue des signes par rapport aux exigences pratiques, notamment dans le contexte du contrôle frontalier.

S. Yanushkevich, E. Berepiki, P. Ciunkiewicz, V. Shmerko, G. Wolbring, R. GuestMon, 09 Ma💻 cs

From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises

Ce papier propose de passer d'une approche de risque basée sur l'évitement à un modèle d'autonomisation des utilisateurs pour les chatbots d'IA générative face aux crises de santé mentale, en les transformant en ponts de soutien et de dé-escalade plutôt qu'en simples réferts vers des lignes d'urgence.

Benjamin Kaveladze, Arka Ghosh, Leah Ajmani, Denae Ford, Peter M Gutierrez, Jetta E Hanson, Eugenia Kim, Keertana Namuduri, Theresa Nguyen, Ebele Okoli, Teresa Rexin, Jessica L Schleider, Hongyi Shen, Jina SuhMon, 09 Ma💻 cs

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Cette étude démontre que, bien que TikTok respecte formellement l'interdiction du ciblage publicitaire pour les mineurs imposée par le Digital Service Act, une audit algorithmique révèle que les contenus promotionnels non étiquetés et le marketing d'influence exploitent une définition restrictive de la publicité pour contourner cette protection en ciblant efficacement les adolescents.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan SrbaMon, 09 Ma🤖 cs.AI

The Values of Value in AI Adoption: Rethinking Efficiency in UX Designers' Workplaces

En s'appuyant sur des ateliers avec 15 designers UX, cette étude démontre que l'adoption de l'IA ne se limite pas à l'efficacité organisationnelle, mais constitue un processus complexe de négociation des valeurs qui reconfigure les rôles, les relations de pouvoir et l'autonomie des travailleurs à travers les échelles individuelle, collective et organisationnelle.

Inha Cha, Catherine Wieczorek, Richmond Y. WongMon, 09 Ma💻 cs

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Ce papier présente THETA, un cadre d'analyse thématique hybride et un agent scientifique IA qui combinent des embeddings adaptatifs et une boucle humaine simulée pour surmonter les limites des modèles traditionnels et permettre une recherche en sciences sociales computationnelles à la fois évolutive, rigoureuse et riche sur le plan théorique.

Zhenke Duan, Xin LiMon, 09 Ma💻 cs

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

Le papier présente SemFuzz, un cadre de fuzzing sémantique qui utilise des modèles de langage pour extraire des règles des RFC et générer des cas de test visant à révéler des vulnérabilités profondes dans les implémentations de protocoles réseau, ayant ainsi permis de découvrir et de confirmer plusieurs failles inconnues.

Yanbang Sun, Quan Luo, Yuelin Wang, Qian Chen, Benjin Liu, Ruiqi Chen, Qing Huang, Xiaohong Li, Junjie WangMon, 09 Ma💻 cs

What are AI researchers worried about?

Cette étude, basée sur une enquête auprès de plus de 4 000 chercheurs en IA, révèle que leurs préoccupations se concentrent davantage sur les risques sociotechniques actuels que sur les risques existentiels souvent mis en avant dans le débat public, montrant ainsi une convergence d'opinions avec la population et appelant à une collaboration pour atténuer les dangers immédiats.

Cian O'Donovan, Sarp Gurakan, Ananya Karanam, Xiaomeng Wu, Jack StilgoeMon, 09 Ma💻 cs

Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion

Cette étude révèle que, malgré une bonne adéquation sur les questions sociales générales, les grands modèles de langage actuels échouent à refléter fidèlement les opinions religieuses, en particulier celles des minorités, dans les contextes asiatiques, perpétuant ainsi des stéréotypes et des biais culturels que les interventions légères ne parviennent pas à éliminer.

Hari Shankar, Vedanta S P, Sriharini Margapuri, Debjani Mazumder, Ponnurangam Kumaraguru, Abhijnan ChakrabortyMon, 09 Ma💬 cs.CL