Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation
이 논문은 낮은 인지욕구와 성실성을 가진 학생들의 참여를 높이기 위해 AI 기반 힌트 설명을 개인화한 결과, 해당 학생들의 설명 상호작용, 힌트 이해도 및 학습 성과가 향상되었음을 실증적으로 입증했습니다.
3957 편의 논문
이 논문은 낮은 인지욕구와 성실성을 가진 학생들의 참여를 높이기 위해 AI 기반 힌트 설명을 개인화한 결과, 해당 학생들의 설명 상호작용, 힌트 이해도 및 학습 성과가 향상되었음을 실증적으로 입증했습니다.
이 논문은 구조적 가지치기 시 단일 그레인 의존성의 한계를 극복하고, 미세 및 거시 그레인의 가중치 중요도를 적응적으로 결합한 하이브리드 그레인 가중치 중요도 평가 (HyWIA) 방법을 제안하여 대규모 언어 모델의 성능 저하 없이 효율적인 압축을 가능하게 합니다.
이 논문은 대규모 언어 모델이 인간의 인지 과정보다는 외부적·사회적 실체로서의 언어를 과학적으로 모델링하는 데 유용한 도구임을 주장하며, 이를 위한 모델 해석 (model construal) 을 개발할 수 있음을 논증합니다.
본 연구는 28 년간의 장기 모니터링 데이터를 활용하여 랜덤 포레스트 모델과 SHAP 등의 설명 가능한 머신러닝 기법을 적용해 아드리아해 굴 독성 (DSP) 발생을 예측하고, 주요 원인 종과 환경 요인을 규명하여 조기 경보 시스템 및 지속 가능한 양식업에 기여하는 결과를 도출했습니다.
이 논문은 사전 훈련된 대규모 언어 모델 (LLM) 을 활용한 진화 알고리즘을 통해 파이썬과 같은 표준 프로그래밍 언어로 표현된 해석 가능한 제어 정책을 자동 생성하여, 블랙박스 신경망 기반 제어의 투명성 문제를 해결하고 인간이 쉽게 수정 및 적용할 수 있도록 하는 새로운 방법을 제안합니다.
이 논문은 압축된 대규모 언어 모델 (LLM) 의 정확도 저하를 미세 조정 없이 저랭크 행렬과 최적화된 CUDA 커널을 통해 보상하여 다양한 배포 시나리오에서 유연하고 효율적인 성능 향상을 가능하게 하는 'EoRA'라는 새로운 방법을 제안합니다.
이 논문은 LLM 의 지도 미세 조정 (SFT) 시 개별 토큰의 품질을 평가하여 유해하거나 정보성이 낮은 토큰을 필터링하고 핵심 정보를 보존하는 '토큰 클리닝' 프레임워크를 제안함으로써 하류 작업 성능을 향상시킨다고 설명합니다.
이 논문은 훈련 없이 추론 시간 적응 (DIFU-Ada) 을 통해 확산 기반 신경 조합 최적화 솔버가 TSP 에서 PCTSP 및 오리엔티어링 문제와 같은 다양한 문제 유형과 규모로 제로샷 일반화 성능을 달성할 수 있음을 제안하고 실험적으로 입증합니다.
이 논문은 DEXPI 데이터 모델을 그래프로 변환하고 그래프 기반 검색 증강 생성 (Graph-RAG) 기술을 대규모 언어 모델에 통합하여 자연어로 P&ID 와 소통하고 환각을 줄이며 엔지니어의 업무 효율을 높이는 방법론을 제안합니다.
이 논문은 텍스트와 이미지의 상호작용을 악용하는 타이포그래픽 공격의 취약성을 평가하기 위해 1,162 개의 이미지로 구성된 대규모 데이터셋 'SCAM'을 제안하고, 이를 통해 최신 멀티모달 모델의 취약점과 방어 전략에 대한 실증적 통찰을 제공합니다.
이 논문은 과거 수요에 의존하고 재고 부족으로 인해 판매 데이터가 검열 (censored) 되는 동적 재고 및 가격 결정 문제를 해결하기 위해, 검열된 의존적 수요 환경에서 최적 정책을 학습하는 새로운 데이터 기반 알고리즘을 제안하고 그 성능을 이론적 및 실험적으로 검증합니다.
이 논문은 고정된 작업 전환 간격의 한계를 극복하고 간섭을 줄이며 확장 가능한 다중 작업 학습을 가능하게 하기 위해, 활성 수상돌기와 듀얼 구조를 갖춘 심층 스파이킹 Q-네트워크와 보상 및 내부 동역학을 기반으로 한 적응형 작업 전환 정책을 결합한 'SwitchMT' 방법론을 제안합니다.
이 논문은 대형 언어 모델 (LLM) 의 평가와 향상을 위해 심리측정학의 이론과 도구를 체계적으로 적용하는 새로운 학제간 분야인 'LLM 심리측정학'을 정립하고, 인간 중심의 AI 발전 방향을 제시합니다.
이 논문은 비전문가 (노인 및 어린이) 가 자주 사용하는 모호한 지시어 (REs) 가 로봇 작업 계획 성능을 크게 저하시킨다는 문제를 제기하고, 이를 해결하기 위해 실용적 이론에 기반한 벤치마크 'REI-Bench'와 작업 지향적 맥락 인지 기법을 제안합니다.
이 논문은 자연어 지시문을 의사코드 (pseudo-code) 로 변환하여 학습 데이터를 증강하는 훈련 방식을 제안함으로써, LLM 의 지시 따르기 능력을 크게 향상시키고 수학적 및 상식 추론 성능도 유지하거나 개선하는 방법을 제시합니다.
이 논문은 2022 년부터 2025 년 초까지의 25 만 건의 학술 논문을 분석하여 대규모 언어 모델 (LLM) 의 한계 연구 동향을 데이터 기반으로 체계적으로 조사하고, 추론과 일반화, 환각, 편향, 보안 등 주요 연구 주제의 변화와 성장 추세를 제시합니다.
이 논문은 새로운 환경에서 여러 사전 학습된 모델의 예측 오류를 식별하고 관리하기 위해 일관성 기반 귀납 추론을 적용하여, 개별 모델이나 기존 앙상블 방법보다 높은 정밀도와 재현율을 달성하는 프레임워크를 제안합니다.
이 논문은 소매 판매 예측을 위해 다양한 머신러닝 모델을 비교 분석한 결과, 복잡한 딥러닝 아키텍처보다 XGBoost 와 같은 트리 기반 앙상블 모델이 결측치와 간헐적 수요가 있는 실제 환경에서 더 우수한 성능을 보였음을 시사합니다.
이 논문은 인간이 제공한 정답이나 전문가 시연 없이도 로봇이 스스로 수집한 경험을 통해 비전 기반 계획 모델을 반복적으로 업데이트하여 새로운 작업의 수행 능력을 지속적으로 향상시키는 'SILVR' 프레임워크를 제안하고 그 유효성을 입증합니다.
이 논문은 강화학습 (RL) 의 한계를 보완하고 새로운 지식 습득을 가능하게 하기 위해 RL 과 온라인 파인튜닝을 교차적으로 수행하는 'ReLIFT'라는 새로운 훈련 방식을 제안하며, 이를 통해 기존 모델의 능력을 넘어선 추론 성능 향상과 데이터 효율성을 입증했습니다.