Understanding In-Context Learning Beyond Transformers: An Investigation of State Space and Hybrid Architectures

이 논문은 행동 분석과 개입 기반 방법을 결합하여 다양한 아키텍처의 대규모 언어 모델에서 문맥 학습 (ICL) 의 내부 메커니즘을 탐구하며, 특히 기능 벡터가 매개변수 지식 검색에 중요한 역할을 하지만 Mamba2 는 다른 메커니즘을 사용할 수 있음을 규명했습니다.

Shenran Wang, Timothy Tin-Long Tse, Jian Zhu2026-03-02💬 cs.CL

Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning

이 논문은 소규모 오픈소스 LLM 이 다단계 추론 문제를 해결할 때 Supervised Fine-Tuning 과 Reinforcement Learning 의 한계를 극복하기 위해, 전문가 행동과 유사한 단계별 논리적 행동을 생성하도록 학습시키는 'Supervised Reinforcement Learning (SRL)' 프레임워크를 제안하고, 이를 통해 추론 및 소프트웨어 엔지니어링 작업에서 뛰어난 성능을 입증합니다.

Yihe Deng, I-Hung Hsu, Jun Yan + 7 more2026-03-02💬 cs.CL

Error-Aware Knowledge Distillation via Targeted Revision for Customer-Service Summarization

이 논문은 GPT-3.5 의 오류를 분석하고 Llama 3.1 70B 를 활용해 이를 수정한 고품질 데이터로 작은 오픈소스 모델을 미세조정하는 'Analyze-Revise-Finetune' 파이프라인을 제안하여, 고객 서비스 요약 분야에서 더 큰 독점 모델보다 우수한 성능을 달성하고 비용 효율성과 데이터 프라이버시를 개선하는 방법을 제시합니다.

Hee-Jin Lee, Zhen Guo, Luchao Jin + 1 more2026-03-02💬 cs.CL

GRDD+: An Extended Greek Dialectal Dataset with Cross-Architecture Fine-tuning Evaluation

이 논문은 크레타, 키프로스, 폰토스, 북부 그리스어 등 기존 데이터를 확장하고 6 가지 새로운 그리스 방언을 추가하여 총 10 개 방언 637 만 단어로 구성된 대규모 데이터셋 'GRDD+'를 구축하고, 이를 통해 다양한 LLM 아키텍처의 미세 조정 성능을 최첨단 모델과 비교 평가한 연구를 소개합니다.

Stergios Chatzikyriakidis, Dimitris Papadakis, Sevasti-Ioanna Papaioannou + 1 more2026-03-02💬 cs.CL

Modeling Clinical Uncertainty in Radiology Reports: from Explicit Uncertainty Markers to Implicit Reasoning Pathways

이 논문은 방사선 보고서의 명시적 불확실성을 정량화하고 암시적 불확실성을 진단 경로 기반으로 확장하는 프레임워크를 제안하여, 불확실성을 고려한 이미지 분류 및 진단 추론을 가능하게 하는 'Lunguage++'라는 향상된 벤치마크를 공개했습니다.

Paloma Rabaey, Jong Hak Moon, Jung-Oh Lee + 4 more2026-03-02💬 cs.CL

Steering Language Models with Weight Arithmetic

이 논문은 두 개의 반대되는 미세조정 가중치 차이를 계산하여 모델 파라미터를 산술적으로 조작하는 '대비 가중치 조향 (contrastive weight steering)' 기법을 제안함으로써, 제한된 훈련 데이터로도 시크피언시 (sycophancy) 와 같은 원치 않는 행동을 완화하거나 의도적으로 유도하면서도 모델의 일반적 능력을 유지하고 훈련 중에는 나타나지 않는 잠재적 오정렬을 탐지할 수 있음을 보여줍니다.

Constanza Fierro, Fabien Roger2026-03-02💬 cs.CL

The Growing Gains and Pains of Iterative Web Corpora Crawling: Insights from South Slavic CLASSLA-web 2.0 Corpora

이 논문은 남슬라브어군 7 개 언어의 웹 코퍼스 (CLASSLA-web 2.0) 를 구축하여 어휘량을 대폭 확장하고 주제 라벨을 추가했으나, 2 년 만의 재크롤링에서도 콘텐츠의 80% 가 새로 생성되었음과 동시에 기계 생성 사이트의 증가로 인한 웹 콘텐츠의 질적 저하라는 새로운 과제를 드러냈음을 보고합니다.

Taja Kuzman Pungeršek, Peter Rupnik, Vít Suchomel + 1 more2026-03-02💬 cs.CL

CSyMR: Benchmarking Compositional Music Information Retrieval in Symbolic Music Reasoning

이 논문은 자연어 질의와 심볼릭 악보 간의 불일치로 인해 기존 대형 언어 모델이 다루기 어려웠던 복합적 음악 정보 검색 (MIR) 을 해결하기 위해, 실제 사용자 시나리오에 기반한 벤치마크 'CSyMR-Bench'와 이를 위한 도구 기반 추론 프레임워크를 제안하고, 이를 통해 모델의 정확도를 5-7% 향상시켰음을 보여줍니다.

Boyang Wang, Yash Vishe, Xin Xu + 4 more2026-03-02⚡ eess

LEC-KG: An LLM-Embedding Collaborative Framework for Domain-Specific Knowledge Graph Construction -- A Case Study on SDGs

이 논문은 LLM 의 의미 이해와 지식 그래프 임베딩의 구조적 추론을 상호 보완적으로 결합한 LEC-KG 프레임워크를 제안하여, 특히 희소 관계가 많은 지속가능발전목표 (SDG) 와 같은 도메인별 비정형 텍스트로부터 고품질의 지식 그래프를 구축하는 방법을 제시합니다.

Yikai Zeng, Yingchao Piao, Changhua Pei + 1 more2026-03-02💬 cs.CL

ViMultiChoice: Toward a Method That Gives Explanation for Multiple-Choice Reading Comprehension in Vietnamese

이 논문은 베트남어 다지선다형 독해 모델이 정답 선택과 함께 그 근거를 설명할 수 있도록 하는 새로운 데이터셋과 'ViMultiChoice'라는 방법을 제안하며, 이를 통해 기존 베이스라인을 능가하는 성능을 달성하고 설명 생성과 정답 예측의 공동 학습이 정확도 향상에 기여함을 입증했습니다.

Trung Tien Cao, Lam Minh Thai, Nghia Hieu Nguyen + 2 more2026-03-02💬 cs.CL

Stop Unnecessary Reflection: Training LRMs for Efficient Reasoning with Adaptive Reflection and Length Coordinated Penalty

이 논문은 불필요한 반성으로 인한 계산 오버헤드를 줄이면서도 정확도를 향상시키기 위해 문제 복잡도에 기반한 적응형 반성 및 길이 조정 패널티를 도입한 강화 학습 프레임워크 ARLCP 를 제안하고, 이를 통해 대형 추론 모델의 효율성과 정확도 간의 균형을 크게 개선함을 보여줍니다.

Zewei Yu, Lirong Gao, Yuke Zhu + 4 more2026-03-02💬 cs.CL

HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam

이 논문은 Frontier LLM 평가 벤치마크인 '인류의 마지막 시험 (HLE)'의 노이즈 문제를 해결하기 위해 전문가 검토와 모델 기반 교차 검증을 통해 문제를 검증하고 수정한 'HLE-Verified'를 구축하여, 오류 수정을 통해 모델 평가의 정확성과 신뢰성을 크게 향상시켰음을 보여줍니다.

Weiqi Zhai, Zhihai Wang, Jinghang Wang + 32 more2026-03-02💬 cs.CL