EDDA-Coordinata: An Annotated Dataset of Historical Geographic Coordinates

이 논문은 18 세기 프랑스 백과전서에서 추출한 지리적 좌표의 정밀한 주석 데이터셋 (EDDA-Coordinata) 을 구축하고 이를 기반으로 학습된 트랜스포머 모델을 통해 고전 텍스트에서 좌표를 자동으로 추출 및 정규화하는 두 단계의 방법을 제안하며, 이를 다양한 언어와 도메인에서 검증한 결과를 제시합니다.

Ludovic Moncla, Pierre Nugues, Thierry Joliveau + 1 more2026-03-02💬 cs.CL

Task Complexity Matters: An Empirical Study of Reasoning in LLMs for Sentiment Analysis

이 논문은 추론 기능이 감정 분석 과제의 복잡도에 따라 성능에 상반된 영향을 미쳐 단순 작업에서는 오히려 성능을 저하시키지만 복잡한 작업에서는 향상시킨다는 것을 실증적으로 보여주며, 계산 비용 대비 효율성을 고려할 때 추론은 단순 작업보다는 복잡한 감정 인식 과제에 한정적으로 유용함을 밝힙니다.

Donghao Huang, Zhaoxia Wang2026-03-02💬 cs.CL

A Novel Hierarchical Multi-Agent System for Payments Using LLMs

이 논문은 기존 LLM 기반 에이전트들이 해결하지 못했던 결제 업무의 자동화 과제를 해결하기 위해, 대화형 결제 에이전트부터 감독 및 라우팅 에이전트까지의 계층적 구조를 통해 종단 간 결제 워크플로우를 구현한 최초의 다중 에이전트 시스템인 HMASP 를 제안하고 그 타당성을 입증합니다.

Joon Kiat Chua, Donghao Huang, Zhaoxia Wang2026-03-02💬 cs.CL

Preference Packing: Efficient Preference Optimization for Large Language Models

이 논문은 동일한 입력 프롬프트에 대한 서로 다른 응답을 사용하는 선호도 최적화 (DPO 등) 훈련 시 중복 프롬프트의 어텐션 연산과 KV 캐시 메모리 사용을 줄여 훈련 시간을 최대 37% 단축하고 기존 최적화 기법과 결합 시 3.22 배의 속도 향상을 이루는 '선호도 패킹 (Preference Packing)' 기법을 제안합니다.

Jaekyung Cho2026-03-02💬 cs.CL

Recycling Failures: Salvaging Exploration in RLVR via Fine-Grained Off-Policy Guidance

이 논문은 RLVR 환경에서 부분적으로 올바른 추론 경로를 폐기하지 않고 프로세스 보상 모델을 활용해 첫 번째 오류 단계를 정밀하게 수정함으로써 탐색 다양성을 확보하고 수학 및 일반화 추론 성능을 획기적으로 개선하는 새로운 프레임워크 'SCOPE'를 제안합니다.

Yanwei Ren, Haotian Zhang, Likang Xiao + 6 more2026-03-02💬 cs.CL

Terminology Rarity Predicts Catastrophic Failure in LLM Translation of Low-Resource Ancient Languages: Evidence from Ancient Greek

이 연구는 고대 그리스어 전문 텍스트 번역에서 LLM 의 성능이 전문 용어의 희소성에 의해 결정되며, 특히 미번역된 약학 텍스트에서 용어 빈도가 번역 실패를 강력하게 예측한다는 것을 인간 평가와 자동 지표를 통해 입증했습니다.

James L. Zainaldin, Cameron Pattison, Manuela Marai + 2 more2026-03-02💬 cs.CL

MT-PingEval: Evaluating Multi-Turn Collaboration with Private Information Games

이 논문은 비공개 정보를 공유하는 협력 게임을 통해 다중 턴 상호작용을 평가하는 'MT-PingEval'을 제안하며, 최신 언어 모델이 비대화식 기준보다 협력적 대화를 통해 성능을 향상시키지 못하고 인간보다 일관성 있는 대화와 토큰 효율성을 보여주지 못한다는 사실을 규명했습니다.

Jacob Eisenstein, Fantine Huot, Adam Fisch + 2 more2026-03-02💬 cs.CL

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

이 논문은 외부 도구나 추가 학습 없이 MLLM 의 내부 모달리티 특징만을 활용하여 샘플 응답의 불일치 조정 시맨틱 볼륨을 계산함으로써 다양한 모달리티와 작업에서 기존 방법보다 우수한 불확실성 정량화 성능을 보이는 새로운 프레임워크인 UMPIRE 를 제안합니다.

Gregory Kang Ruey Lau, Hieu Dao, Nicole Kan Hui Lin + 1 more2026-03-02💬 cs.CL