Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Dit artikel biedt een survey van Computerized Adaptive Testing (CAT) vanuit een machine learning-perspectief, waarbij wordt onderzocht hoe deze technieken de meetmodellen, vraagselectie, bankconstructie en testbeheer kunnen optimaliseren om robuustere, eerlijkere en efficiëntere adaptieve testsystemen te ontwikkelen.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

Dit onderzoek toont aan dat het combineren van Large Language Models voor het extraheren van cognitieve en taalkundige kenmerken met boomgebaseerde machine learning-algoritmen een nauwkeuriger methode biedt om de moeilijkheidsgraad van K-5 wiskunde- en leesitems te voorspellen dan directe schattingen door LLM's, waardoor de afhankelijkheid van uitgebreide veldtests kan worden verminderd.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

Dit paper introduceert XInsight, een multi-agent framework dat digitale psychologische ondersteuning structureert volgens het 'Exploration-Insight-Action'-paradigma met gespecialiseerde agents voor case-conceptualisering, therapeutische routing en reflectie, en introduceert XInsight-Bench voor transparante evaluatie om de bruikbaarheid van dergelijke systemen voor digitaal welzijn te vergroten.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

Dit artikel voorspelt dat voorgestelde federale bezuinigingen op onderzoeksondersteuning onder de Trump-regering in 2026 zullen leiden tot een aanzienlijke toename van de hoeveelheid R1-universiteiten waarbij meer dan de helft van het faculteitspersoneel onvoldoende middelen heeft voor kwalitatief hoogstaand onderzoek, wat de continuïteit van STEAM- en doctoraatsprogramma's in gevaar brengt.

Robert A. BrownTue, 10 Ma🔬 physics

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Dit hoofdstuk onderzoekt hoe generatieve kunstmatige intelligentie kan fungeren als een katalysator voor coherentie in het onderwijs, de leerprocessen en de beoordeling van wetenschappelijke geletterdheid op K-16+ niveau, terwijl het ook de conceptuele en praktische uitdagingen en de noodzakelijke architectuur voor implementatie belicht.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Deze studie toont aan dat grote taalmodellen in de Nepalese context aanzienlijke sociale vooroordelen vertonen, waarbij impliciete generatieve bias sterk verschilt van expliciete instemming en een niet-lineair verband vertoont met de temperatuurinstelling, wat de noodzaak benadrukt van cultureel onderbouwde evaluatie- en debiasingstrategieën.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

Dit onderzoek analyseert de governance van AI-genererde content op 40 socialemediaplatforms en concludeert dat hoewel de meeste platforms zich richten op moderatie en transparantie, er behoefte is aan meer uitgebreide, toekomstgerichte beleidslijnen en educatie, vooral op het gebied van eigendom en monetarisatie.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs