How Much Noise Can BERT Handle? Insights from Multilingual Sentence Difficulty Detection

이 논문은 다국어 문장 난이도 감지 작업에서 BERT 기반 모델이 노이즈에 어느 정도 내재적 강건성을 갖지만, GMM 기반 노이즈 필터링과 같은 명시적 노이즈 제거 기법을 적용하면 소규모 데이터셋에서 성능이 크게 향상됨을 입증하고, 이를 통해 가장 큰 규모의 다국어 문장 난이도 예측 코퍼스를 공개했습니다.

Nouran Khallaf, Serge Sharoff2026-03-10💬 cs.CL

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

이 논문은 자율적 의사결정 시스템으로서의 에이전트 기반 검색 증강 생성 (Agentic RAG) 을 체계화하기 위해 수학적 형식화, 통합 분류 체계, 평가 방법론의 한계 및 시스템적 위험 분석을 제시하고, 향후 신뢰성 있는 시스템 구축을 위한 연구 방향을 제시합니다.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Can Large Language Models Keep Up? Benchmarking Online Adaptation to Continual Knowledge Streams

이 논문은 동적으로 변화하는 지식 스트림에 실시간으로 적응하는 대규모 언어 모델의 능력을 평가하기 위해 'OAKS'라는 새로운 벤치마크를 제안하고, 기존 최첨단 모델 및 에이전트 메모리 시스템이 상태 추적 지연과 주의 분산 문제로 인해 이러한 적응에 심각한 한계를 보임을 규명합니다.

Jiyeon Kim, Hyunji Lee, Dylan Zhou, Sue Hyun Park, Seunghyun Yoon, Trung Bui, Franck Dernoncourt, Sungmin Cha, Minjoon Seo2026-03-10💬 cs.CL

Generalization in Online Reinforcement Learning for Mobile Agents

이 논문은 모바일 GUI 에이전트의 일반화 능력을 평가하기 위한 새로운 벤치마크 'AndroidWorld-Generalization'과 확장 가능한 RL 학습 시스템을 제안하고, 그룹 상대적 정책 최적화 (GRPO) 를 적용한 실험을 통해 일반화 문제의 현재 한계와 잠재력을 규명했습니다.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

이 논문은 이기종 데이터베이스 시스템의 각기 다른 SQL 문법과 제약 조건을 고려하여 자연어에서 실행 가능한 SQL 쿼리를 생성하는 지식 기반 프레임워크 'Dial'을 제안하고, 논리적 쿼리 계획, 계층적 지식 베이스, 실행 기반 디버깅 루프를 통해 기존 방법론 대비 번역 정확도와 기능 커버리지를 크게 향상시켰음을 보여줍니다.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

이 논문은 어텐션과 피드포워드 네트워크를 각각 토큰 스트림과 컨텍스트 스트림으로 분리하여 해석 가능성과 성능 사이의 조절 가능한 균형을 제공하는 '듀얼-스트림 트랜스포머' 아키텍처를 제안하고, 이를 통해 내부 구조가 설계 단계에서 노출되는 해석 가능한 언어 모델의 기반을 마련했다고 요약할 수 있습니다.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs

이 논문은 확산 언어 모델이 자기회귀 모델과 달리 계층적 표현 구조와 초기 층의 중복성을 가지며, 이를 활용한 정적 계층 건너뛰기 기법으로 추가적인 구조 변경 없이 추론 시 연산량을 18.75%까지 줄이면서도 성능을 유지할 수 있음을 보여줍니다.

Raghavv Goel, Risheek Garrepalli, Sudhanshu Agrawal, Chris Lott, Mingu Lee, Fatih Porikli2026-03-10💬 cs.CL

A Joint Neural Baseline for Concept, Assertion, and Relation Extraction from Clinical Text

이 논문은 임상 텍스트의 개념 인식, 주장 분류, 관계 추출이라는 세 가지 태스크를 독립적인 파이프라인 방식이 아닌 단일 엔드투엔드 신경망 모델로 통합하여 최적화함으로써 기존 파이프라인 기반 접근법보다 성능을 크게 향상시키는 새로운 공동 베이스라인을 제안합니다.

Fei Cheng, Ribeka Tanaka, Sadao Kurohashi2026-03-10💬 cs.CL

Bolbosh: Script-Aware Flow Matching for Kashmiri Text-to-Speech

이 논문은 카슈미르어 화자 약 700 만 명을 위한 최초의 오픈소스 신경망 TTS 시스템인 'Bolbosh'를 제안하며, 오프트멀 트랜스포트 조건부 흐름 매칭 (OT-CFM) 과 스크립트 인식 적응 전략을 통해 저자원 언어의 텍스트 음성 변환 성능을 획기적으로 개선했음을 보여줍니다.

Tajamul Ashraf, Burhaan Rasheed Zargar, Saeed Abdul Muizz, Ifrah Mushtaq, Nazima Mehdi, Iqra Altaf Gillani, Aadil Amin Kak, Janibul Bashir2026-03-10💬 cs.CL

TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning

이 논문은 할루시네이션을 완화하기 위해 기억 기반 계획 가지치기, 신뢰도 기반 행동 정제, 이중 가중치 궤적 집계라는 불확실성 인식 추론 프레임워크를 도입하여 기존 TableMind 의 한계를 극복하고 테이블 추론 성능을 획기적으로 향상시킨 'TableMind++'를 제안합니다.

Mingyue Cheng, Shuo Yu, Chuang Jiang, Xiaoyu Tao, Qingyang Mao, Jie Ouyang, Qi Liu, Enhong Chen2026-03-10💬 cs.CL