Multi-Agent Causal Reasoning for Suicide Ideation Detection Through Online Conversations

이 논문은 온라인 대화에서 자살 사고를 탐지하기 위해 인지 평가 이론을 기반으로 한 반사실적 사용자 반응을 생성하는 추론 에이전트와 프론트 도어 조정 전략을 통해 숨겨진 편향을 완화하는 편향 인식 의사결정 에이전트를 협력적으로 활용하는 다중 에이전트 인과 추론 (MACR) 프레임워크를 제안합니다.

Jun Li, Xiangmeng Wang, Haoyang Li + 6 more2026-03-02💬 cs.CL

BRIDGE the Gap: Mitigating Bias Amplification in Automated Scoring of English Language Learners via Inter-group Data Augmentation

이 논문은 영어 학습자 (ELL) 의 자동 채점에서 발생하는 편향 증폭 문제를 해결하기 위해, 풍부한 비-ELL 고득점 샘플의 내용과 ELL 의 언어적 패턴을 결합한 가짜 데이터를 생성하는 'BRIDGE' 프레임워크를 제안하고, 이를 통해 California 과학 시험 (CAST) 데이터에서 편향을 효과적으로 완화하면서도 전체 채점 성능을 유지함을 입증합니다.

Yun Wang, Xuansheng Wu, Jingyuan Huang + 3 more2026-03-02💬 cs.CL

TRIZ-RAGNER: A Retrieval-Augmented Large Language Model for TRIZ-Aware Named Entity Recognition in Patent-Based Contradiction Mining

이 논문은 기존 방법론의 한계를 극복하고 특허 기반 모순 마이닝의 정확도를 향상시키기 위해 TRIZ 지식 베이스 검색을 통합한 새로운 대규모 언어 모델 프레임워크인 TRIZ-RAGNER 을 제안하고, PaTRIZ 데이터셋 실험을 통해 기존 모델 대비 우수한 성능을 입증합니다.

Zitong Xu, Yuqing Wu, Yue Zhao2026-03-02💬 cs.CL

From Static Benchmarks to Dynamic Protocol: Agent-Centric Text Anomaly Detection for Evaluating LLM Reasoning

이 논문은 정적 데이터셋의 한계를 극복하고 LLM 의 진화하는 추론 능력을 평가하기 위해, 자율 에이전트들이 문제를 생성·검증·해결하는 동적 프로토콜을 도입하여 텍스트 이상 탐지 형식을 통해 기존 벤치마크가 놓친 추론 오류를 체계적으로 포착하는 새로운 평가 패러다임을 제안합니다.

Seungdong Yoa, Sanghyu Yoon, Suhee Yoon + 4 more2026-03-02💬 cs.CL

UTPTrack: Towards Simple and Unified Token Pruning for Visual Tracking

이 논문은 시각적 객체 추적의 계산 비용을 줄이면서도 정확도를 유지하기 위해 검색 영역, 동적 템플릿, 정적 템플릿을 통합적으로 압축하는 새로운 단일 토큰 가지치기 프레임워크인 UTPTrack 을 제안하고, 다양한 벤치마크에서 기존 방법보다 뛰어난 성능과 효율성을 입증합니다.

Hao Wu, Xudong Wang, Jialiang Zhang + 5 more2026-03-02💬 cs.CL

Structured Prompt Optimization for Few-Shot Text Classification via Semantic Alignment in Latent Space

이 논문은 소량 데이터 환경에서의 텍스트 분류 성능을 향상시키기 위해, 다차원 의미 요인으로 구성된 구조화된 프롬프트와 잠재 공간 내 의미 정렬 메커니즘을 도입하여 의미적 혼란을 해소하고 라벨 불명확성을 개선하는 최적화 프레임워크를 제안합니다.

Jiasen Zheng, Zijun Zhou, Huajun Zhang + 3 more2026-03-02💬 cs.CL

Divide and Conquer: Accelerating Diffusion-Based Large Language Models via Adaptive Parallel Decoding

이 논문은 확산 기반 대규모 언어 모델 (dLLM) 의 이론적 병렬성과 실제 성능 간의 격차를 해소하기 위해, 분할 (Divide) 과 정복 (Conquer) 단계를 반복하고 마지막에 정제 단계를 거치는 적응형 병렬 디코딩 기법인 'DiCo'를 제안하여 추론 속도를 크게 향상시키면서도 생성 품질을 유지하는 방법을 제시합니다.

Xiangzhong Luo, Yilin An, Zhicheng Yu + 2 more2026-03-02💬 cs.CL

CLFEC: A New Task for Unified Linguistic and Factual Error Correction in paragraph-level Chinese Professional Writing

이 논문은 중국어 전문 글쓰기에서 언어적 오류와 사실적 오류를 통합적으로 수정하는 새로운 태스크인 CLFEC 를 제안하고, 이를 위한 다도메인 데이터셋을 구축하여 대규모 언어 모델 기반의 다양한 수정 패러다임을 체계적으로 평가하고 산업 현장 적용을 위한 실증적 통찰을 제공합니다.

Jian Kai, Zidong Zhang, Jiwen Chen + 5 more2026-03-02💬 cs.CL

SWE-rebench V2: Language-Agnostic SWE Task Collection at Scale

이 논문은 20 개 이상의 프로그래밍 언어와 3,600 개 이상의 저장소에서 32,000 개 이상의 실행 가능한 소프트웨어 엔지니어링 (SWE) 태스크와 12 만 개 이상의 확장 데이터를 포함하는 대규모 언어 중립적 SWE 벤치마크인 'SWE-rebench V2'를 소개하며, 이를 통해 강화학습 기반 SWE 에이전트 훈련을 위한 재현 가능한 환경과 데이터셋을 제공합니다.

Ibragim Badertdinov, Maksim Nekrashevich, Anton Shevtsov + 1 more2026-03-02💬 cs.CL

Ref-Adv: Exploring MLLM Visual Reasoning in Referring Expression Tasks

이 논문은 기존 참조 표현 이해 (REC) 벤치마크의 단점을 보완하고 단순한 단서 의존성을 배제하기 위해 고안된 'Ref-Adv'라는 새로운 벤치마크를 제시하며, 이를 통해 최신 멀티모달 LLM 들이 기존 데이터셋에서는 높은 성능을 보이지만 실제 시각적 추론과 정밀한 grounding 능력에서는 심각한 한계를 드러냄을 규명합니다.

Qihua Dong, Kuo Yang, Lin Ju + 6 more2026-03-02💬 cs.CL

Benchmarking BERT-based Models for Sentence-level Topic Classification in Nepali Language

이 논문은 25,006 개의 문장으로 구성된 네덜란드어 데이터셋을 사용하여 10 가지 BERT 기반 모델을 벤치마크한 결과, MuRIL-large 가 90.60% 의 F1 점수로 가장 우수한 성능을 보였으며, 이는 네덜란드어 NLP 응용을 위한 강력한 기준을 제시한다는 내용을 담고 있습니다. *(참고: 원문 초록에 'Nepali(네팔어)'라고 명시되어 있으나, 번역 시 'Devanagari script(데바나가리 문자)'와 'Nepali(네팔어)'의 혼동을 방지하기 위해 'Nepali'를 '네팔어'로 정확히 번역했습니다. 위 문장에서는 '네덜란드어'가 아닌 '네팔어'로 수정하여 작성해야 합니다.)* **수정된 정확한 답변:** 이 논문은 25,006 개의 문장으로 구성된 네팔어 데이터셋을 사용하여 10 가지 BERT 기반 모델을 벤치마크한 결과, MuRIL-large 가 90.60% 의 F1 점수로 가장 우수한 성능을 보였으며, 이는 네팔어 NLP 응용을 위한 강력한 기준을 제시한다는 내용을 담고 있습니다.

Nischal Karki, Bipesh Subedi, Prakash Poudyal + 2 more2026-03-02💬 cs.CL

EDDA-Coordinata: An Annotated Dataset of Historical Geographic Coordinates

이 논문은 18 세기 프랑스 백과전서에서 추출한 지리적 좌표의 정밀한 주석 데이터셋 (EDDA-Coordinata) 을 구축하고 이를 기반으로 학습된 트랜스포머 모델을 통해 고전 텍스트에서 좌표를 자동으로 추출 및 정규화하는 두 단계의 방법을 제안하며, 이를 다양한 언어와 도메인에서 검증한 결과를 제시합니다.

Ludovic Moncla, Pierre Nugues, Thierry Joliveau + 1 more2026-03-02💬 cs.CL