cs.AI 편의 논문 | Gist.Science

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

이 논문은 낮은 인지욕구와 성실성을 가진 학생들의 참여를 높이기 위해 AI 기반 힌트 설명을 개인화한 결과, 해당 학생들의 설명 상호작용, 힌트 이해도 및 학습 성과가 향상되었음을 실증적으로 입증했습니다.

Vedant Bahel, Harshinee Sriram, Cristina Conati2026-03-12🤖 cs.AI

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

이 논문은 구조적 가지치기 시 단일 그레인 의존성의 한계를 극복하고, 미세 및 거시 그레인의 가중치 중요도를 적응적으로 결합한 하이브리드 그레인 가중치 중요도 평가 (HyWIA) 방법을 제안하여 대규모 언어 모델의 성능 저하 없이 효율적인 압축을 가능하게 합니다.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Modelling Language using Large Language Models

이 논문은 대규모 언어 모델이 인간의 인지 과정보다는 외부적·사회적 실체로서의 언어를 과학적으로 모델링하는 데 유용한 도구임을 주장하며, 이를 위한 모델 해석 (model construal) 을 개발할 수 있음을 논증합니다.

Jumbly Grindrod2026-03-12💬 cs.CL

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

본 연구는 28 년간의 장기 모니터링 데이터를 활용하여 랜덤 포레스트 모델과 SHAP 등의 설명 가능한 머신러닝 기법을 적용해 아드리아해 굴 독성 (DSP) 발생을 예측하고, 주요 원인 종과 환경 요인을 규명하여 조기 경보 시스템 및 지속 가능한 양식업에 기여하는 결과를 도출했습니다.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

이 논문은 사전 훈련된 대규모 언어 모델 (LLM) 을 활용한 진화 알고리즘을 통해 파이썬과 같은 표준 프로그래밍 언어로 표현된 해석 가능한 제어 정책을 자동 생성하여, 블랙박스 신경망 기반 제어의 투명성 문제를 해결하고 인간이 쉽게 수정 및 적용할 수 있도록 하는 새로운 방법을 제안합니다.

Carlo Bosio, Mark W. Mueller2026-03-12⚡ eess

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

이 논문은 압축된 대규모 언어 모델 (LLM) 의 정확도 저하를 미세 조정 없이 저랭크 행렬과 최적화된 CUDA 커널을 통해 보상하여 다양한 배포 시나리오에서 유연하고 효율적인 성능 향상을 가능하게 하는 'EoRA'라는 새로운 방법을 제안합니다.

Shih-Yang Liu, Maksim Khadkevich, Nai Chit Fung, Charbel Sakr, Chao-Han Huck Yang, Chien-Yi Wang, Saurav Muralidharan, Hongxu Yin, Kwang-Ting Cheng, Jan Kautz, Yu-Chiang Frank Wang, Pavlo Molchanov, Min-Hung Chen2026-03-12💬 cs.CL

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

이 논문은 LLM 의 지도 미세 조정 (SFT) 시 개별 토큰의 품질을 평가하여 유해하거나 정보성이 낮은 토큰을 필터링하고 핵심 정보를 보존하는 '토큰 클리닝' 프레임워크를 제안함으로써 하류 작업 성능을 향상시킨다고 설명합니다.

Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng, Chen Qian, Yang Liu2026-03-12💬 cs.CL

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

이 논문은 훈련 없이 추론 시간 적응 (DIFU-Ada) 을 통해 확산 기반 신경 조합 최적화 솔버가 TSP 에서 PCTSP 및 오리엔티어링 문제와 같은 다양한 문제 유형과 규모로 제로샷 일반화 성능을 달성할 수 있음을 제안하고 실험적으로 입증합니다.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Talking like Piping and Instrumentation Diagrams (P&IDs)

이 논문은 DEXPI 데이터 모델을 그래프로 변환하고 그래프 기반 검색 증강 생성 (Graph-RAG) 기술을 대규모 언어 모델에 통합하여 자연어로 P&ID 와 소통하고 환각을 줄이며 엔지니어의 업무 효율을 높이는 방법론을 제안합니다.

Achmad Anggawirya Alimin, Dominik P. Goldstein, Lukas Schulze Balhorn + 1 more2026-03-12🤖 cs.AI

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

이 논문은 텍스트와 이미지의 상호작용을 악용하는 타이포그래픽 공격의 취약성을 평가하기 위해 1,162 개의 이미지로 구성된 대규모 데이터셋 'SCAM'을 제안하고, 이를 통해 최신 멀티모달 모델의 취약점과 방어 전략에 대한 실증적 통찰을 제공합니다.

Justus Westerhoff, Erblina Purelku, Jakob Hackstein + 4 more2026-03-12🤖 cs.AI

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

이 논문은 과거 수요에 의존하고 재고 부족으로 인해 판매 데이터가 검열 (censored) 되는 동적 재고 및 가격 결정 문제를 해결하기 위해, 검열된 의존적 수요 환경에서 최적 정책을 학습하는 새로운 데이터 기반 알고리즘을 제안하고 그 성능을 이론적 및 실험적으로 검증합니다.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

이 논문은 고정된 작업 전환 간격의 한계를 극복하고 간섭을 줄이며 확장 가능한 다중 작업 학습을 가능하게 하기 위해, 활성 수상돌기와 듀얼 구조를 갖춘 심층 스파이킹 Q-네트워크와 보상 및 내부 동역학을 기반으로 한 적응형 작업 전환 정책을 결합한 'SwitchMT' 방법론을 제안합니다.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

← 이전 다음 →

cs.AI

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Modelling Language using Large Language Models

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Talking like Piping and Instrumentation Diagrams (P&IDs)

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?

Training with Pseudo-Code for Instruction Following

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Self-Improving Loops for Visual Robotic Planning

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions