cs.CL 편의 논문 | Gist.Science

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM

이 논문은 vLLM 의 내부 상태를 프로그래밍할 수 있게 하여 적대적 프롬프트 탐지, 향상된 RAG, 활성화 조향 등 다양한 테스트 시간 모델 정렬 및 개선 기법을 가능하게 하는 오픈소스 플러그인 'vLLM Hook'을 제안합니다.

Ching-Yun Ko, Pin-Yu Chen2026-03-10🤖 cs.LG

ARC-AGI-2 Technical Report

이 논문은 대칭성 기반 증강, 테스트 시간 학습 (TTT) 을 통한 LoRA 적응, 그리고 다중 관점 추론을 결합한 변형된 LongT5 아키텍처를 통해 ARC-AGI-2 에서 인간 수준의 일반화 능력에 근접하는 성능을 달성한 새로운 트랜스포머 기반 시스템을 제시합니다.

Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe Carthy2026-03-10💬 cs.CL

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

이 논문은 대규모 언어 모델에서 의미 정보 없이도 입력 시퀀스의 첫 번째 토큰에 집중되는 '어텐션 싱크'가 P0 싱크 회로를 통해 어떻게 형성되고 학습 초기에 두 번째 레이어까지 집중되며 사전 학습 수렴 상태를 추적하는 신호가 될 수 있는지를 규명합니다.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng Qiu2026-03-10🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

이 논문은 확률적 문맥 자유 문법 (PCFG) 을 기반으로 한 위계적 데이터 생성 과정이 인덕션 헤드, 함수 벡터, 하이드라 효과 등 거대언어모델의 서로 다른 기계적 현상들을 통합적으로 설명하는 핵심 요인임을 이론적 근거와 실험을 통해 규명합니다.

Jonas Rohweder, Subhabrata Dutta, Iryna Gurevych2026-03-10🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

이 논문은 대규모 코드 저장소의 정보를 고정된 수의 의사 토큰으로 압축하여 지연 시간을 획기적으로 줄이면서도 저장소 수준의 맥락을 유지하는 계층적 임베딩 융합 (HEF) 방식을 제안합니다.

Nikita Sorokin, Ivan Sedykh, Valentin Malykh2026-03-10🤖 cs.LG

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

이 논문은 LLM 을 심판자로 활용한 자동화된 안전성 평가 프레임워크가 적대적 공격 시 발생하는 분포 변화로 인해 무작위 추측 수준으로 성능이 저하된다는 점을 6,642 개의 인간 검증 라벨을 통해 입증하고, 더 신뢰할 수 있는 평가를 위해 새로운 벤치마크와 데이터셋을 제안합니다.

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan Günnemann2026-03-10💬 cs.CL

Rethinking Personalization in Large Language Models at the Token Level

이 논문은 토큰 수준에서 개인화 정도를 추정하고 가중치를 동적으로 조정하는 'PerContrast' 방법과 'PerCE' 손실 함수를 제안하여, 기존 대형 언어 모델의 개인화 성능을 크게 향상시키고 다양한 작업과 시나리오에 효과적으로 적용 가능한 새로운 패러다임을 제시합니다.

Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen Lin2026-03-10💬 cs.CL

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

이 논문은 구조화된 태스크의 분류 레이블과 개방형 생성의 자기평가 응답을 기반으로 정규화된 신뢰도 점수를 도입하여 LLM 의 오류와 환각을 외부 검증 없이 탐지하는 프레임워크를 제시하고, 강화학습이 신뢰도를 저하시키는 반면 자기교란을 통한 사후 SFT 가 이를 회복시켜 RAG 시스템의 효율성을 극대화함을 증명합니다.

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

이 논문은 기술 문서의 계층적 구조를 활용한 계층적 검색과 자동 생성 테스트 케이스를 통한 자기 디버깅 에이전트를 도입하여 복잡한 그래프 추론 작업의 정확도를 높이고 추론 비용을 줄이는 'GraphSkill' 프레임워크와 새로운 평가 데이터셋을 제안합니다.

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang Wang2026-03-10🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

이 논문은 TTT(Test-Time Training) 모델의 긴 문맥 기억 한계를 해결하기 위해, 예측하기 어려운 토큰만 전통적인 어텐션 캐시에 저장하고 나머지는 압축된 상태에 유지하는 'SR-TTT'라는 새로운 아키텍처를 제안합니다.

Swamynathan V P2026-03-10🤖 cs.LG

TimeSpot: Benchmarking Geo-Temporal Understanding in Vision-Language Models in Real-World Settings

이 논문은 비전 - 언어 모델의 지리 - 시간적 추론 능력을 평가하기 위해 80 개국의 1,455 장 이미지를 포함한 'TimeSpot' 벤치마크를 제안하고, 기존 모델들의 성능이 특히 시간적 추론 분야에서 여전히 부족함을 입증했습니다.

Azmine Toushik Wasi, Shahriyar Zaman Ridoy, Koushik Ahamed Tonmoy, Kinga Tshering, S. M. Muhtasimul Hasan, Wahid Faisal, Tasnim Mohiuddin, Md Rizwan Parvez2026-03-10💬 cs.CL

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

이 논문은 CoreML 을 우회하여 애플의 신경 엔진 (ANE) 을 직접 제어하고, 컴파일 재구성을 최적화하며 LoRA 어댑터를 지원하는 'Orion'이라는 오픈 소스 시스템을 통해 애플 기기에서 대규모 언어 모델의 온디바이스 학습과 추론을 가능하게 했음을 제시합니다.

Ramchand Kumaresan2026-03-10🤖 cs.LG

"Dark Triad" Model Organisms of Misalignment: Narrow Fine-Tuning Mirrors Human Antisocial Behavior

이 논문은 인간의 다크 트라이어드 (나르시시즘, 심리병, 매너키니즘) 특성을 기반으로 한 좁은 파인튜닝이 대형 언어 모델 (LLM) 에서 인간과 유사한 반사회적 행동과 정렬 실패를 유도할 수 있음을 실증적으로 보여주며, 이를 통해 생물학적 및 인공지능적 정렬 문제를 이해하기 위한 새로운 모델 유기체 프레임워크를 제시합니다.

Roshni Lulla, Fiona Collins, Sanaya Parekh, Thilo Hagendorff, Jonas Kaplan2026-03-10💬 cs.CL

Validation of a Small Language Model for DSM-5 Substance Category Classification in Child Welfare Records

이 논문은 미국 중서부 주의 아동복지 조사 기록에서 DSM-5 물질 사용 범주를 식별하기 위해 로컬로 호스팅된 200 억 파라미터 규모의 소형 언어 모델이 알코올, 대마, 오피오이드 등 주요 5 개 범주에서 인간 전문가와 거의 완벽한 일치율을 보이며 신뢰할 수 있는 분류가 가능함을 입증했습니다.

Brian E. Perron, Dragan Stoll, Bryan G. Victor, Zia Qia, Andreas Jud, Joseph P. Ryan2026-03-10💬 cs.CL

Supporting Artifact Evaluation with LLMs: A Study with Published Security Research Papers

이 논문은 대규모 언어 모델 (LLM) 을 활용하여 텍스트 기반 재현성 평가, 실행 환경 자동 구축, 방법론적 결함 탐지 등을 수행하는 도구를 개발함으로써 사이버보안 연구의 아티팩트 평가 효율성을 획기적으로 높이고 재현성을 개선할 수 있음을 입증했습니다.

David Heye, Karl Kindermann, Robin Decker, Johannes Lohmöller, Anastasiia Belova, Sandra Geisler, Klaus Wehrle, Jan Pennekamp2026-03-10💬 cs.CL

Counting on Consensus: Selecting the Right Inter-annotator Agreement Metric for NLP Annotation and Evaluation

이 논문은 NLP 작업 유형과 데이터 특성에 따라 적절한 상호 주석자 일치도 (IAA) 지표를 선택하고 해석하는 방법을 체계적으로 안내하여, 인간 주석 및 평가의 일관성과 재현성을 높이는 것을 목표로 합니다.

Joseph James2026-03-10💬 cs.CL

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

이 논문은 노이즈가 포함된 불완전한 관측 데이터로부터 물리 법칙을 발견하기 위해, 대칭성 제약을 적용한 문법과 언어 모델 기반 프로그램 합성, 그리고 MDL 정규화된 베이지안 모델 선택을 통합한 'SymLang' 프레임워크를 제안하며, 기존 방법론 대비 구조적 정확도와 외삽 성능을 획기적으로 향상시켰음을 보여줍니다.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

← 이전 다음 →

cs.CL