Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Cet article propose une revue de la littérature sur les tests adaptatifs informatisés sous l'angle de l'apprentissage automatique, en examinant comment ces techniques peuvent optimiser les modèles de mesure, la sélection des questions et le contrôle des tests pour créer des systèmes d'évaluation plus robustes, équitables et efficaces.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Cette étude démontre que l'extraction de caractéristiques linguistiques et cognitives par des modèles de langage de grande taille (LLM) pour alimenter des algorithmes d'apprentissage automatique en arbre permet de prédire la difficulté des items d'évaluation avec une précision supérieure à celle des estimations directes par LLM, offrant ainsi une alternative efficace aux tests de terrain coûteux.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

Cet article présente SPOT, le premier corpus annoté et benchmark en français permettant d'identifier les « points d'arrêt » dans les conversations en ligne, et démontre que les modèles encodeurs finement ajustés surpassent les grands modèles de langage pour cette tâche de détection de critiques subtiles.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Ce papier présente XInsight, un cadre multi-agents inspiré par le counseling qui structure le soutien psychologique selon le paradigme « Exploration-Insight-Action » pour améliorer l'interprétabilité, la continuité et l'efficacité des applications de bien-être numérique, validé par une nouvelle plateforme d'évaluation appelée XInsight-Bench.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

Cette étude évalue la vulnérabilité des migrants d'Afrique subsaharienne face aux arnaques alimentées par l'intelligence artificielle et révèle que l'exposition antérieure au ciblage est le principal facteur de risque, tandis que la confiance dans la détection du contenu IA et les efforts de vérification comportementale agissent comme des facteurs protecteurs significatifs.

Deborah OluwasanyaTue, 10 Ma💻 cs

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

Cette étude modélise l'impact potentiel des réductions proposées par l'administration Trump sur le financement de la recherche fédérale en 2026, prévoyant que cela entraînerait une augmentation significative du nombre d'universités de recherche où plus de la moitié des professeurs disposeraient de ressources insuffisantes, menaçant ainsi la viabilité des programmes doctoraux et de la recherche de qualité aux États-Unis.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

Cette étude utilise l'inférence causale pour démontrer que les auteurs issus de groupes raciaux minoritaires, les femmes et ceux affiliés à des institutions du Sud global subissent des désavantages statistiques significatifs dans les processus d'évaluation par les pairs, soulignant ainsi la nécessité urgente d'interventions pour garantir l'équité dans les revues académiques traditionnelles et celles assistées par l'intelligence artificielle.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Ce chapitre examine comment l'intelligence artificielle générative peut servir d'outil de cohérence pour améliorer l'alphabétisation scientifique dans les programmes K-16+, en définissant les nouveaux enjeux, en proposant une architecture technique pour intégrer l'IA dans l'enseignement et l'évaluation, et en identifiant les défis de recherche et de développement nécessaires.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Cette étude montre que, dans l'éducation au design, l'intelligence artificielle générative agit principalement comme un accélérateur cognitif utilisé aux étapes initiales, tandis que les compétences humaines fondamentales (agence, connaissances disciplinaires, imagination et goût) restent indispensables pour interpréter, valider et affiner les solutions créatives.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

Cet article propose une troisième ambition pour la recherche en intelligence artificielle, consistant à utiliser les grands modèles de langage comme instruments scientifiques pour étudier le comportement humain, la culture et le raisonnement moral en exploitant les régularités symboliques qu'ils ont apprises, tout en clarifiant leurs limites épistémiques et en adaptant les méthodologies des sciences sociales à cette nouvelle échelle.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Cette étude évalue les biais sociaux de sept grands modèles de langage dans le contexte culturel népalais sous-représenté, révélant que les biais implicites de génération, qui suivent une relation en U avec la température, sont mal capturés par les métriques d'accord explicite et varient selon les domaines culturels.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Cette étude examine les cadres de gouvernance de 40 plateformes de médias sociaux face à la prolifération du contenu généré par l'IA, révélant que la majorité se concentre sur la modération des violations et la divulgation, tandis que les questions de propriété et de monétisation sont moins abordées, ce qui appelle à des politiques plus complètes et à des outils éducatifs pour les utilisateurs.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs