cs.CL 편의 논문 | Gist.Science

Individual Turing Test: A Case Study of LLM-based Simulation Using Longitudinal Personal Data

이 논문은 10 년 이상의 개인 메시징 데이터를 기반으로 다양한 LLM 시뮬레이션 기법을 평가한 결과, 친분 있는 지인에게는 현재 기술이 '개인 튜링 테스트'를 통과하지 못하지만, 언어 스타일과 개인적 의견에 따라 파인튜닝과 검색/메모리 기반 접근법 간에 명확한 성능 trade-off 가 존재함을 규명했습니다.

Minghao Guo, Ziyi Ye, Wujiang Xu + 3 more2026-03-03💬 cs.CL

JailNewsBench: Multi-Lingual and Regional Benchmark for Fake News Generation under Jailbreak Attacks

이 논문은 34 개 지역과 22 개 언어를 포괄하는 최초의 벤치마크인 JailNewsBench 를 제안하여, 다양한 언어와 지역에서 LLM 의 지옥공격 (jailbreak) 을 통한 가짜 뉴스 생성에 대한 방어 취약점과 안전성 불균형을 체계적으로 평가했습니다.

Masahiro Kaneko, Ayana Niwa, Timothy Baldwin2026-03-03💬 cs.CL

I Can't Believe It's Not Robust: Catastrophic Collapse of Safety Classifiers under Embedding Drift

이 논문은 지시 튜닝된 추론 모델의 임베딩이 미세하게 변형될 경우 안전 분류기가 고신뢰도 오분류로 인한 침묵적 실패를 겪으며, 오히려 정렬된 시스템이 안전 보호가 더 어려워진다는 것을 보여줍니다.

Subramanyam Sahoo, Vinija Jain, Divya Chaudhary + 1 more2026-03-03💬 cs.CL

Catalyst-Agent: Autonomous heterogeneous catalyst screening and optimization with an LLM Agent

이 논문은 LLM 기반의 자율 에이전트 'Catalyst-Agent'가 대규모 재료 데이터베이스를 탐색하고 구조를 수정하며 흡착 에너지를 계산하는 폐쇄 루프 워크플로우를 통해 산소, 질소, 이산화탄소 환원 반응과 같은 핵심 촉매 반응을 효율적으로 선별하고 최적화하여 과학적 발견을 가속화한다는 것을 보여줍니다.

Achuth Chandrasekhar, Janghoon Ock, Amir Barati Farimani2026-03-03💬 cs.CL

Truth as a Trajectory: What Internal Representations Reveal About Large Language Model Reasoning

이 논문은 LLM 의 추론을 고정된 활성화가 아닌 층 간 기하학적 이동 궤적으로 모델링하여 '진실 궤적 (Truth as a Trajectory)'을 제안함으로써, 기존 탐지법의 어휘적 편향을 극복하고 추론의 유효성을 더 정확하게 식별할 수 있음을 보여줍니다.

Hamed Damirchi, Ignacio Meza De la Jara, Ehsan Abbasnejad + 3 more2026-03-03💬 cs.CL

SWE-Adept: An LLM-Based Agentic Framework for Deep Codebase Analysis and Structured Issue Resolution

이 논문은 LLM 기반의 두 에이전트 (위치 파악 및 해결) 프레임워크인 SWE-Adept 를 제안하여, 에이전트 주도 심도 우선 탐색과 적응적 계획 및 버전 관리 도구를 통해 대규모 코드베이스 분석 및 문제 해결 성능을 향상시켰음을 보여줍니다.

Kang He, Kaushik Roy2026-03-03💬 cs.CL

MetaState: Persistent Working Memory for Discrete Diffusion Language Models

이 논문은 이산 확산 언어 모델의 단계 간 정보 단절 문제를 해결하기 위해, 고정된 크기의 지속적 작업 기억 (MetaState) 을 도입하여 생성 품질을 향상시키는 경량화 방법을 제안합니다.

Kejing Xia, Mingzhe Li, Lixuan Wei + 4 more2026-03-03💬 cs.CL

PanCanBench: A Comprehensive Benchmark for Evaluating Large Language Models in Pancreatic Oncology

이 논문은 실제 췌장암 환자 질문과 전문가 평가 기준을 기반으로 한 벤치마크 'PanCanBench'를 개발하여 다양한 대규모 언어 모델의 임상적 완전성, 사실성, 그리고 웹 검색 통합 효과를 평가하고, 최신 모델이 반드시 사실 오류를 줄이는 것은 아니며 AI 생성 평가 기준이 점수를 부풀릴 수 있음을 밝혔습니다.

Yimin Zhao, Sheela R. Damle, Simone E. Dekker + 13 more2026-03-03💬 cs.CL

Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain

이 논문은 도메인별 전문 용어를 기반으로 고품질의 합성 지시 데이터 (CoT 포함) 를 구축하는 일반적 방법을 제안하고, 이를 일본 금융 도메인에 적용하여 95 억 토큰 규모의 데이터셋을 생성한 결과, 베이스라인 모델 대비 금융 벤치마크 성능이 향상됨을 입증하고 관련 모델과 데이터를 오픈소스로 공개했습니다.

Yuma Okochi, Fabio Milentiansen Sim, Tomoyasu Okada2026-03-03💬 cs.CL

NM-DEKL $^3_\infty$ : A Three-Layer Non-Monotone Evolving Dependent Type Logic

이 논문은 동적 환경에서 진화하는 지식을 형식화하기 위해 계산, 구성적 지식, 명제적 지식의 세 계층 구조를 가진 새로운 종속 타입 시스템인 NM-DEKL $^3_\infty$ 를 제안하고, 그 문법과 의미론을 정의하며 초기 모델 구성을 통해 건전성과 방정식 완전성을 증명하고 $\mu$ -계산에 대한 임베딩 및 비동형 불변 속성의 표현 가능성을 포함하는 엄격한 표현력 포함 관계를 규명합니다.

Peng Chen2026-03-03💬 cs.CL

DARS: Dysarthria-Aware Rhythm-Style Synthesis for ASR Enhancement

이 논문은 정상 및 구음장애 발화 간의 대비적 선호도를 기반으로 리듬 예측기를 최적화하고 병리적 음향 스타일을 시뮬레이션하는 'DARS' 프레임워크를 제안하여, 합성 구음장애 발화 데이터를 활용한 Whisper 기반 자동음성인식 시스템의 단어오류율을 기존 최선 방법 대비 54.22% 상대적으로 감소시켰음을 보여줍니다.

Minghui Wu, Xueling Liu, Jiahuan Fan + 3 more2026-03-03💬 cs.CL

End-to-End Simultaneous Dysarthric Speech Reconstruction with Frame-Level Adaptor and Multiple Wait-k Knowledge Distillation

이 논문은 프레임 레벨 어댑터와 다중 웨이트-k 지식 증류를 통해 지연 시간을 줄이고 ASR 오류에 대한 내성을 강화하며, UASpeech 데이터셋에서 기존 최첨단 모델 대비 54.25% 의 단어 오류율 감소와 4.67 점의 MOS 를 달성한 엔드 - 투 - 엔드 동시 구 dysarthria 음성 재구성 시스템을 제안합니다.

Minghui Wu, Haitao Tang, Jiahuan Fan + 2 more2026-03-03💬 cs.CL

Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning

이 논문은 기존 그래프 토큰화 LLM 의 텍스트 편향을 해결하기 위해 그래프 정보를 명시적으로 재구성하는 '재구성 그래프 지시 미세조정 (RGLM)' 파이프라인을 제안하고, 이를 통해 그래프와 텍스트 간의 정렬 효과를 이론적으로 증명하고 실험적으로 검증합니다.

Zhongjian Zhang, Xiao Wang, Mengmei Zhang + 2 more2026-03-03💬 cs.CL

SciDER: Scientific Data-centric End-to-end Researcher

SciDER 는 실험에서 수집된 원시 데이터를 자동으로 처리하고 가설을 생성하며 코드를 실행하는 데이터 중심의 종단 간 과학 연구 자동화 시스템으로, 자기 진화 메모리와 비판자 피드백 루프를 통해 기존 모델보다 우수한 성능을 입증했습니다.

Ke Lin, Yilin Lu, Shreyas Bhat + 3 more2026-03-03💬 cs.CL

Quantifying Conversational Reliability of Large Language Models under Multi-Turn Interaction

이 논문은 대규모 언어 모델 (LLM) 이 실제 환경에서 다중 턴 대화를 수행할 때 신뢰성이 현저히 저하된다는 것을 체계적으로 평가하고, 지시 이탈 및 의도 혼란 등 주요 실패 요인을 규명하여 신뢰할 수 있는 배포를 위한 강화된 평가 방법의 필요성을 강조합니다.

Jiyoon Myung2026-03-03💬 cs.CL

LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

이 논문은 LLM 의 추론 능력을 활용하면서도 지연 시간을 줄이기 위해 명시적 추론 과정을 잠재 공간에 내재화하는 새로운 자기 증류 프레임워크인 LaSER 를 제안하여, 밀도 기반 검색의 성능과 효율성을 동시에 향상시킵니다.

Jiajie Jin, Yanzhao Zhang, Mingxin Li + 4 more2026-03-03💬 cs.CL

Understanding the Physics of Key-Value Cache Compression for LLMs through Attention Dynamics

이 논문은 KV 캐시 압축을 단순한 저장 공간 최적화가 아닌 어텐션 라우팅의 물리적 관점에서 재해석하여, 90% 압축 시 발생하는 의미적 접근성 붕괴와 모델별 라우팅 역학의 차이가 장기 컨텍스트 확장성의 핵심 한계임을 규명합니다.

Samhruth Ananthanarayanan, Ayan Sengupta, Tanmoy Chakraborty2026-03-03💬 cs.CL

Enhancing Persona Following at Decoding Time via Dynamic Importance Estimation for Role-Playing Agents

이 논문은 역할 수행 에이전트의 상황 의존적 특성을 반영하기 위해 심리학 이론에 기반하여 맥락에 따라 역할 중요도를 동적으로 추정하고 이를 추론 시간의 가중치 보상 안내 디코딩에 통합하는 '역할 동적 디코딩 (PDD)' 프레임워크를 제안하여, 기존 고정된 프롬프트나 비용이 많이 드는 파인튜닝의 한계를 극복하고 더 높은 일관성과 충실도를 달성함을 보여줍니다.

Yuxin Liu, Mingye Zhu, Siyuan Liu + 2 more2026-03-03💬 cs.CL

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

이 논문은 인간의 인지 효율성을 모방하기 위해 퍼지-트레이스 이론에 기반한 MM-Mem 을 제안하여, 멀티모달 비디오 에이전트가 장시간의 비디오를 이해할 때 발생하는 문맥 제한과 기억 한계를 해결하고, 의미 정보 병목 원리를 통해 정밀한 지각 정보를 고차원적 의미 스키마로 점진적으로 압축·추출하는 새로운 메모리 아키텍처를 제시합니다.

Niu Lian, Yuting Wang, Hanshu Yao + 5 more2026-03-03💬 cs.CL

Power Echoes: Investigating Moderation Biases in Online Power-Asymmetric Conflicts

이 논문은 온라인 권력 불균형 갈등 상황에서 인간 중재자가 보이는 권력 편향과 AI 제안이 이에 미치는 영향을 실증적으로 분석하여, 인간과 AI 의 협력적 중재 시스템에 대한 통찰을 제시합니다.

Yaqiong Li, Peng Zhang, Peixu Hou + 7 more2026-03-03💬 cs.CL

← 이전 다음 →

cs.CL