Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

이 논문은 인도 카르나타카 주의 저자원 학교에서 1,043 명의 교사와 23 명의 커리큘럼 전문가를 대상으로 한 대규모 혼합연구를 통해, AI 와 교사의 협업을 통해 커스터마이징된 수업 계획 도구인 'Shiksha Copilot'이 행정 업무 부담을 줄이고 활동 중심 교수법으로의 전환을 촉진했으나, 인력 부족 등 구조적 한계로 인해 포괄적인 교수법 변화에는 제약이 있음을 규명하고 다국어 및 글로벌 사우스 맥락에 적합한 교 중심 EdTech 설계 방향을 제시합니다.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

이 논문은 이탈리아 청취자를 대상으로 한 인터뷰와 감정 텍스트 분석을 통해, 추천 시스템에 대한 비판적 이해 부족과 성별 대표성 인식의 한계를 드러내며, 신뢰할 수 있고 문화적으로 민감한 음악 추천 시스템 설계에 심리사회적 통찰의 통합 필요성을 강조합니다.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

이 논문은 GPT 모델의 세대 간 '공감 능력'은 통계적으로 유의미한 차이가 없으나, 위기 상황 감지 능력은 향상되고 조언의 안전성은 저하되는 등 안전성 태도가 변화했으며, 사용자들이 느끼는 공감 상실은 이러한 안전성 조정의 결과임을 임상적 평가를 통해 규명했습니다.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

이 논문은 12 억 파라미터 규모의 트라이링구얼 GPT-2 기반 TOBA-LM 모델에 어그라티브 토크나이저와 50 만 개의 임베딩을 가진 적응형 엔그램 메모리 메커니즘을 통합하여, 인도네시아어, 바탁어, 민앙카바우어 모델 개발 시 기존 트랜스포머 대비 학습 효율을 80% 향상시키고 수렴 속도를 획기적으로 개선했다는 결과를 제시합니다.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

μ\muEd API: Towards A Shared API for EdTech Microservices

이 논문은 대규모 학습 환경에서 특정 도메인의 자동화를 가능하게 하고 상호 운용 가능한 에코시스템을 구축하기 위해 4 개 기관의 기존 시스템 기능을 통합한 교육용 마이크로서비스 표준 API(μ\muEd) 의 초기 사양을 제안합니다.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

이 논문은 EU 인공지능법 하에서 일반 목적 AI 모델 제공자에게 부과된 시스템적 위험 평가 의무가 혁신을 저해하지 않으면서도 실효적인 위험 정보를 제공할 수 있도록, EU 법의 비례성 원칙을 기반으로 한 과학적 평가 방법론의 개발 필요성과 실천 방안을 논의합니다.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

이 논문은 대규모 언어 모델 (LLM) 의 사용자의 견해에 미치는 영향을 평가하기 위해 deliberative opinion polling 과정을 표준으로 삼은 'DeliberationBench'를 제안하고, 4,088 명의 미국 참가자를 대상으로 한 실험을 통해 해당 모델들이 민주적으로 정당한 기준에 부합하며 사용자의 자율성을 해치지 않는 긍정적인 인식적 영향을 미친다는 것을 입증했습니다.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-ReaulxThu, 12 Ma💻 cs