Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

이 논문은 TOON 이 인-도메인 생성 작업에서 토큰 효율성과 정확도 면에서 유망한 결과를 보이지만, 짧은 컨텍스트에서는 프롬프트 오버헤드로 인해 이점이 감소하며, 특히 단순 구조에서는 제약 디코딩을 통한 JSON 생성이 TOON 보다 더 낮은 토큰 사용량을 보여 TOON 의 효율성은 특정 임계점을 넘어 누적된 구문 절감 효과가 프롬프트 오버헤드를 상쇄할 때 비로소 실현된다는 것을 밝혔습니다.

Ivan Matveev2026-03-05🤖 cs.AI

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

이 논문은 LLM 기반의 시맨틱 분석과 VARK 학습 스타일 인지 프로파일링을 결합한 하이브리드 프레임워크를 제안하여, 사용자 및 아이템의 상호작용 데이터가 부족한 콜드 스타트 문제를 해결하고 초기 접촉 단계에서도 개인화되고 설명 가능한 추천을 가능하게 합니다.

Nikita Zmanovskii2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

이 논문은 EEG 신호에서 자연어를 해독할 때 발생하는 의미 편향과 신호 무시 문제를 해결하기 위해, 감성·주제·길이·놀라움이라는 네 가지 분리된 의미 목표를 통해 신경 입력에 기반한 생성을 강제하는 'SemKey' 프레임워크를 제안하고, 기존 BLEU 점수의 한계를 넘어 N-way 검색 정확도 및 프라체트 거리와 같은 새로운 평가 지표를 통해 모델의 성능을 입증합니다.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

이 논문은 외부 도구에 의존하지 않고 대규모 언어 모델의 내재적 프롬프트 노이즈 저항력을 향상시키기 위해 대비 학습 기반 역 선호도 최적화 (CoIPO) 방법을 제안하고, 이를 검증하기 위해 NoisyPromptBench 벤치마크를 구축하여 기존 최첨단 기법보다 뛰어난 성능을 입증했습니다.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

이 논문은 밈의 의미와 독성 (toxicity) 을 포괄적으로 이해하기 위한 새로운 의미론적 프레임워크와 이를 기반으로 생성된 609 개의 질문 - 답변 쌍으로 구성된 M-QUEST 벤치마크를 제안하고, 다양한 오픈소스 대형 언어 모델의 성능을 평가하여 밈 해석에 있어 지시 튜닝과 추론 능력이 중요함을 입증했습니다.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

Quantum-Inspired Self-Attention in a Large Language Model

이 논문은 기존 양자 자기주의 메커니즘이 텍스트 분류에만 국한되었던 것과 달리, GPT-1 의 전체 자동회귀 언어 모델링 파이프라인에 양자에서 영감을 받은 자기주의 (QISA) 를 최초로 통합하여, 추론 시간 2.6 배 증가에 비해 오타율, 단어 오류율, 교차 엔트로피 손실에서 각각 15.5 배, 4.7 배, 13 배의 획기적인 성능 향상을 달성했다고 요약할 수 있습니다.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

이 논문은 사회적 과학 이론과 귀납적 추론을 기반으로 한 신경-상징적 접근법을 제안하여, 기존 대규모 언어 모델이 수행하기 어려운 '우리'에서 '나'로의 서사 전환 과제를 성공적으로 해결하고 원본 메시지의 충실도를 유지하면서도 서사적 일관성을 크게 향상시켰음을 보여줍니다.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

이 논문은 인간 평가 패턴과 부합하는 형식적 속성과 독립성 제약을 적용하여 지시 사항을 유형별 술어로 자동 분해하고 만족도를 평가하는 대화형 LLM 지시 수행 평가 프레임워크인 DIALEVAL 을 제안하며, 이를 통해 기존 방법 대비 오류를 26.45% 줄이고 인간 판단과의 상관관계를 크게 향상시켰음을 보여줍니다.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

이 논문은 안전성 정렬 과정에서 발생하는 과도한 거절 (over-refusal) 문제를 해결하기 위해, 실제 유해한 콘텐츠와 겉보기에 유해한 콘텐츠를 명확히 구분하는 '대조적 정제 (Contrastive Refinement)' 기법을 도입하여 모델의 유용성과 안전성을 동시에 향상시키는 새로운 정렬 단계를 제안합니다.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI