cs.CY 편의 논문 | Gist.Science

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

이 논문은 교육에서 AI 오용 문제를 탐지의 과제가 아닌 학습 과정의 가시성 상실이라는 측정 문제로 재정의하고, 감시 대신 투명성과 공유 증거를 기반으로 한 '학습 가시성 프레임워크'를 제안합니다.

Eduardo Davalos, Yike ZhangTue, 10 Ma💻 cs

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

이 논문은 GitHub 에서 별점이나 다운로드 수와 같은 사회적 증거를 인위적으로 조작해도 오픈소스 소프트웨어의 다운로드나 개발자 참여 활동에 유의미한 영향을 미치지 않는다는 것을 두 가지 현장 실험을 통해 규명했습니다.

Lucas Shen, Gaurav SoodTue, 10 Ma💻 cs

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

이 논문은 의료 데이터 거버넌스를 위해 SQL 기반 메트릭 정의의 잠재적 프라이버시 위험을 사전에 평가하고 설명 가능한 위험 점수를 부여하여 통계적 유출을 방지하는 AI 기반 프레임워크를 제안합니다.

Mohammed Omer Shakeel AhmedTue, 10 Ma🤖 cs.LG

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

이 논문은 EPSRC 제안서를 대상으로 구조적 변형을 통해 LLM 기반 심사 방식을 평가한 결과, 섹션 단위 분석이 가장 효과적이었으나 현재 LLM 은 명확성 결함을 놓치고 순응성 확인에 치우쳐 고위험 평가에서는 보조적 역할만 수행할 수 있음을 밝혔습니다.

William Thorne, Joseph James, Yang Wang, Chenghua Lin, Diana MaynardTue, 10 Ma💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

이 논문은 개인 및 집단 공정성을 모두 포괄하는 '판별 위험 (discriminative risk)' 지표를 제안하고, 이를 기반으로 마진 의존적 오라클 바운드를 통해 앙상블 조합이 공정성을 이론적으로 보장하며 향상시킬 수 있음을 증명합니다.

Yijun BianThu, 12 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

이 논문은 낮은 인지욕구와 성실성을 가진 학생들의 참여를 높이기 위해 AI 기반 힌트 설명을 개인화한 결과, 해당 학생들의 설명 상호작용, 힌트 이해도 및 학습 성과가 향상되었음을 실증적으로 입증했습니다.

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

이 논문은 인도 카르나타카 주의 저자원 학교에서 1,043 명의 교사와 23 명의 커리큘럼 전문가를 대상으로 한 대규모 혼합연구를 통해, AI 와 교사의 협업을 통해 커스터마이징된 수업 계획 도구인 'Shiksha Copilot'이 행정 업무 부담을 줄이고 활동 중심 교수법으로의 전환을 촉진했으나, 인력 부족 등 구조적 한계로 인해 포괄적인 교수법 변화에는 제약이 있음을 규명하고 다국어 및 글로벌 사우스 맥락에 적합한 교 중심 EdTech 설계 방향을 제시합니다.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

이 논문은 이탈리아 청취자를 대상으로 한 인터뷰와 감정 텍스트 분석을 통해, 추천 시스템에 대한 비판적 이해 부족과 성별 대표성 인식의 한계를 드러내며, 신뢰할 수 있고 문화적으로 민감한 음악 추천 시스템 설계에 심리사회적 통찰의 통합 필요성을 강조합니다.

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

R v F (2025): Addressing the Defence of Hacking

이 논문은 '해킹 방어' (또는 'SODDI 방어') 를 주장한 R v F 사건을 사례로 들어, 디지털 포렌식 조사관이 이 방어를 어떻게 반박하고 법정에 실증적 증거를 제시할 수 있는지에 대한 실용적인 교훈과 기법을 제시합니다.

Junade AliThu, 12 Ma💻 cs

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

본 연구는 온라인 리뷰 평가 순서 (평가 후 리뷰 vs. 리뷰 후 평가) 가 서비스 품질과 제품 속성에 따라 감성적 휴리스틱과 인지적 노력의 매개 작용을 통해 소비자 평점에 극단화 효과를 미친다는 것을 실험 및 대규모 데이터 분석을 통해 규명했습니다.

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

이 논문은 GPT 모델의 세대 간 '공감 능력'은 통계적으로 유의미한 차이가 없으나, 위기 상황 감지 능력은 향상되고 조언의 안전성은 저하되는 등 안전성 태도가 변화했으며, 사용자들이 느끼는 공감 상실은 이러한 안전성 조정의 결과임을 임상적 평가를 통해 규명했습니다.

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

이 논문은 12 억 파라미터 규모의 트라이링구얼 GPT-2 기반 TOBA-LM 모델에 어그라티브 토크나이저와 50 만 개의 임베딩을 가진 적응형 엔그램 메모리 메커니즘을 통합하여, 인도네시아어, 바탁어, 민앙카바우어 모델 개발 시 기존 트랜스포머 대비 학습 효율을 80% 향상시키고 수렴 속도를 획기적으로 개선했다는 결과를 제시합니다.

Hokky Situngkir, Kevin Siringoringo, Andhika Bernard LumbantobingThu, 12 Ma💬 cs.CL

Open Educational Resources: Barriers and Open Issues

이 논문은 OER(개방형 교육 자원) 의 채택과 지속적 사용을 방해하는 26 가지의 사회·경제·기술적 장벽을 식별하고 전문가 인터뷰를 통해 검증하여, 포용적인 교육 생태계 구축을 위한 전략과 정책 수립에 기여하는 개념 모델을 제시합니다.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi NakagawaThu, 12 Ma💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

이 논문은 대규모 학습 환경에서 특정 도메인의 자동화를 가능하게 하고 상호 운용 가능한 에코시스템을 구축하기 위해 4 개 기관의 기존 시스템 기능을 통합한 교육용 마이크로서비스 표준 API( $\mu$ Ed) 의 초기 사양을 제안합니다.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan KruscheThu, 12 Ma💻 cs

The coordination gap in frontier AI safety policies

이 논문은 최첨단 AI 안전 정책이 예방에 치중하여 실패 시 대응을 조정할 제도적 역량을 소홀히 하는 구조적 격차를 지적하며, 핵안전 및 팬데믹 대비 사례를 참고해 사전 약속과 공유 프로토콜 등을 통해 조정 체계를 구축할 것을 제안합니다.

Isaak MengeshaThu, 12 Ma📈 econ

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

본 논문은 5 개의 대규모 언어 모델을 대상으로 사법 판결 지원 맥락에서 '덕스러운 피해자 효과'와 '후광 효과'가 인간과 유사하게 나타나는지 실험한 결과, 모델 간 편차는 있으나 인간 기준 대비 소폭 개선된 편향을 보였음을 밝혔습니다.

Sierra S. LiuThu, 12 Ma💻 cs

The science and practice of proportionality in AI risk evaluations

이 논문은 EU 인공지능법 하에서 일반 목적 AI 모델 제공자에게 부과된 시스템적 위험 평가 의무가 혁신을 저해하지 않으면서도 실효적인 위험 정보를 제공할 수 있도록, EU 법의 비례성 원칙을 기반으로 한 과학적 평가 방법론의 개발 필요성과 실천 방안을 논의합니다.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout SchellaertThu, 12 Ma💻 cs

← 이전 다음 →

cs.CY

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

R v F (2025): Addressing the Defence of Hacking

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Open Educational Resources: Barriers and Open Issues

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

The coordination gap in frontier AI safety policies

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

cs.CY

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Evaluating LLM-Based Grant Proposal Review via Structured Perturbations

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

R v F (2025): Addressing the Defence of Hacking

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

Adaptive Engram Memory System for Indonesian Language Model: Generative AI Based on TOBA LM for Batak and Minang Language

Open Educational Resources: Barriers and Open Issues

μ\muμEd API: Towards A Shared API for EdTech Microservices

The coordination gap in frontier AI safety policies

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

$\mu$ Ed API: Towards A Shared API for EdTech Microservices