cs.CL 편의 논문 | Gist.Science

TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement

이 논문은 테스트 시 학습 중 발생하는 신뢰할 수 없는 의사레이블과 비효율적인 적응 문제를 해결하기 위해, 실패한 추론 경로를 분석하고 표적 변형 문제를 생성하는 '교사' 역할과 문제 해결을 수행하는 '학생' 역할이 교차하는 자기반성 기반의 TTSR 프레임워크를 제안하여 대형 언어 모델의 추론 능력을 지속적으로 향상시키는 방법을 제시합니다.

Haoyang He, Zihua Rong, Liangjie Zhao + 3 more2026-03-05🤖 cs.AI

TATRA: Training-Free Instance-Adaptive Prompting Through Rephrasing and Aggregation

이 논문은 레이블 데이터나 최적화 루프 없이도 실시간으로 생성된 예시를 통해 인스턴스별 프롬프트를 구성하는 훈련 없는 TATRA 방법을 제안하며, 기존 최적화 기반 방법보다 우수한 성능을 보여줍니다.

Bartosz Dziuba, Kacper Kuchta, Paweł Batorski + 2 more2026-03-05🤖 cs.AI

How LLMs Cite and Why It Matters: A Cross-Model Audit of Reference Fabrication in AI-Assisted Academic Writing and Methods to Detect Phantom Citations

이 논문은 10 개의 상용 대규모 언어 모델 (LLM) 을 대상으로 학술 인용 허위 생성을 광범위하게 분석하여 모델과 도메인에 따른 할루시네이션 발생률 차이를 규명하고, 다중 모델 합의 및 반복 검증 같은 실용적 필터와 외부 데이터베이스 없이도 작동하는 경량 분류기를 통해 위조 인용을 탐지하는 방법을 제시합니다.

MZ Naser2026-03-05💬 cs.CL

Benchmarking Legal RAG: The Promise and Limits of AI Statutory Surveys

이 논문은 LaborBench 벤치마크를 활용하여 STARA 도구가 기존 RAG 및 상용 법률 AI(웨스트로, 렉시스) 보다 뛰어난 성능을 보였으며, 기존 DOL 변호사들의 실수를 보정했을 때 정확도가 92% 에 달한다는 사실과 함께 향후 법적 RAG 시스템 구축을 위한 설계 원칙을 제시합니다.

Mohamed Afane, Emaan Hariri, Derek Ouyang + 1 more2026-03-05💬 cs.CL

From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings

이 논문은 LLM 임베딩을 위한 의미적 캐싱의 최적 오프라인 정책이 NP-난해임을 증명하고, 다항 시간 휴리스틱 및 온라인 정책을 제안하여 다양한 데이터셋에서 기존 빈도 기반 기법보다 향상된 성능을 입증합니다.

Dvir David Biton, Roy Friedman2026-03-05🤖 cs.AI

Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs

이 논문은 주정부 도로국 (State DOTs) 의 지식 관리 및 인력 훈련 효율성을 향상시키기 위해, 전문 에이전트와 비전 - 언어 모델을 활용한 멀티 에이전트 기반의 검색 증강 생성 (RAG) 프레임워크를 제안합니다.

Divija Amaram, Lu Gao, Gowtham Reddy Gudla + 1 more2026-03-05🤖 cs.AI

HumanLM: Simulating Users with State Alignment Beats Response Imitation

이 논문은 사용자의 표면적 언어 패턴이 아닌 심리적 상태를 정렬하는 강화학습 기반의 새로운 훈련 프레임워크 'HumanLM'을 제안하여, 기존 시뮬레이터보다 실제 사용자의 반응을 훨씬 더 정확하게 모사하고 인간과 유사한 성능을 달성했음을 보여줍니다.

Shirley Wu, Evelyn Choi, Arpandeep Khatua + 7 more2026-03-05🤖 cs.AI

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

이 논문은 의미적 계획과 구조적 제어를 분리하는 훈련 없는 추론 절차인 '초안 기반 제약 디코딩 (DCCD)'을 제안하여, 구조화된 생성 작업에서 기존 제약 디코딩 방식보다 엄격한 정확도를 크게 향상시키고 파라미터 효율성을 개선함을 보여줍니다.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

이 논문은 TOON 이 인-도메인 생성 작업에서 토큰 효율성과 정확도 면에서 유망한 결과를 보이지만, 짧은 컨텍스트에서는 프롬프트 오버헤드로 인해 이점이 감소하며, 특히 단순 구조에서는 제약 디코딩을 통한 JSON 생성이 TOON 보다 더 낮은 토큰 사용량을 보여 TOON 의 효율성은 특정 임계점을 넘어 누적된 구문 절감 효과가 프롬프트 오버헤드를 상쇄할 때 비로소 실현된다는 것을 밝혔습니다.

Ivan Matveev2026-03-05🤖 cs.AI

TopicENA: Enabling Epistemic Network Analysis at Scale through Automated Topic-Based Coding

이 논문은 수동 코딩의 한계를 극복하고 대규모 텍스트 코퍼스에 적용 가능한 확장성 있는 분석을 위해 BERTopic 과 ENA 를 결합한 'TopicENA'프레임워크를 제안하고, 다양한 분석 사례를 통해 그 유효성과 설정 가이드라인을 제시합니다.

Owen H. T. Lu, Tiffany T. Y. Hsu2026-03-05🤖 cs.AI

Old Habits Die Hard: How Conversational History Geometrically Traps LLMs

이 논문은 'History-Echoes' 프레임워크를 통해 대화의 과거가 확률적 마르코프 체인과 기하학적 잠재 공간 분석을 통해 LLM 의 미래 생성에 어떻게 편향을 유발하고 기하학적 함정으로 작용하는지 규명합니다.

Adi Simhi, Fazl Barez, Martin Tutek + 2 more2026-03-05🤖 cs.AI

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

이 논문은 LLM 기반의 시맨틱 분석과 VARK 학습 스타일 인지 프로파일링을 결합한 하이브리드 프레임워크를 제안하여, 사용자 및 아이템의 상호작용 데이터가 부족한 콜드 스타트 문제를 해결하고 초기 접촉 단계에서도 개인화되고 설명 가능한 추천을 가능하게 합니다.

Nikita Zmanovskii2026-03-05💬 cs.CL

← 이전 다음 →

cs.CL

TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement

TATRA: Training-Free Instance-Adaptive Prompting Through Rephrasing and Aggregation

How LLMs Cite and Why It Matters: A Cross-Model Audit of Reference Fabrication in AI-Assisted Academic Writing and Methods to Detect Phantom Citations

Benchmarking Legal RAG: The Promise and Limits of AI Statutory Surveys

From Exact Hits to Close Enough: Semantic Caching for LLM Embeddings

Developing an AI Assistant for Knowledge Management and Workforce Training in State DOTs

HumanLM: Simulating Users with State Alignment Beats Response Imitation

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

TopicENA: Enabling Epistemic Network Analysis at Scale through Automated Topic-Based Coding

Old Habits Die Hard: How Conversational History Geometrically Traps LLMs

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

The Logovista English-Japanese Machine Translation System

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

How does fine-tuning improve sensorimotor representations in large language models?

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations