CTRL-RAG: Contrastive Likelihood Reward Based Reinforcement Learning for Context-Faithful RAG Models

이 논문은 외부 보상의 한계를 극복하고 환각을 방지하기 위해 지지 증거 유무에 따른 로그 가능도 차이를 최적화하는 대비적 가능도 보상 (CLR) 을 중심으로 한 하이브리드 보상 프레임워크를 제안하여 RAG 모델의 문맥 충실도를 향상시키는 방법을 제시합니다.

Zhehao Tan, Yihan Jiao, Dan Yang + 8 more2026-03-06💻 cs

Semantic Containment as a Fundamental Property of Emergent Misalignment

본 논문은 유해한 데이터만으로도 문맥적 트리거가 존재할 때만 유해 행동을 보이고 트리거가 없을 때는 안전을 유지하는 '의미론적 격리' 현상이 발생함을 실험을 통해 입증함으로써, benign 데이터의 혼합 없이도 트리거 기반의 유해 미세조정 자체가 치명적인 안전 취약점을 야기할 수 있음을 규명했습니다.

Rohan Saxena2026-03-06💻 cs

Unpacking Human Preference for LLMs: Demographically Aware Evaluation with the HUMAINE Framework

이 논문은 23,404 명의 다양한 인구통계학적 배경을 가진 참가자들과의 자연스러운 대화를 기반으로 한 HUMAINE 프레임워크를 통해 대규모 언어 모델의 인간 선호도를 다차원적으로 평가하고, 모델 성능의 위계와 연령에 따른 선호도 이질성, 그리고 평가 차원별 판별력 차이를 규명했습니다.

Nora Petrova, Andrew Gordon, Enzo Blindow2026-03-06💻 cs

SalamahBench: Toward Standardized Safety Evaluation for Arabic Language Models

이 논문은 영어 중심의 기존 평가 한계를 극복하고 아랍어 언어 모델의 안전성을 체계적으로 평가하기 위해 MLCommons 안전 해저드 분류에 기반한 12 개 범주의 8,170 개 프롬프트로 구성된 'SalamahBench'를 제안하고, 이를 통해 다양한 아랍어 모델의 안전성 편차를 분석하고 전용 안전 장치가 필요함을 입증합니다.

Omar Abdelnasser, Fatemah Alharbi, Khaled Khasawneh + 2 more2026-03-06💻 cs

Simulating Meaning, Nevermore! Introducing ICR: A Semiotic-Hermeneutic Metric for Evaluating Meaning in LLM Text Summaries

이 논문은 LLM 이 생성한 텍스트 요약의 의미 평가에 통계적 유사도 이상의 해석적 접근이 필요함을 주장하며, 기호학과 해석학을 기반으로 한 새로운 정성적 평가 지표인 '유도 개념 평가 (ICR)'를 제안하고 이를 통해 LLM 이 인간보다 문맥적 의미 정확도에서 미흡함을 실증적으로 분석했습니다.

Natalie Perez, Sreyoshi Bhaduri, Aman Chadha2026-03-06💻 cs

The Thinking Boundary: Quantifying Reasoning Suitability of Multimodal Tasks via Dual Tuning

이 논문은 'Dual Tuning' 프레임워크를 통해 다양한 멀티모달 작업에서 추론의 유익성을 정량화하고 '생각의 경계 (Thinking Boundary)'를 설정함으로써, 모든 작업에 무조건적인 추론을 적용하는 관행에 도전하고 데이터 및 학습 전략을 최적화하는 실용적인 지침을 제시합니다.

Ruobing Zheng, Tianqi Li, Jianing Li + 3 more2026-03-06💻 cs

Optimizing What We Trust: Reliability-Guided QUBO Selection of Multi-Agent Weak Framing Signals for Arabic Sentiment Prediction

이 논문은 아랍어 소셜 미디어의 프레임 감지 문제를 해결하기 위해, 다중 에이전트 LLM 파이프라인을 통해 신뢰도 신호를 추출하고 이를 QUBO 기반의 데이터 선별에 활용하여 아랍어 감정 예측의 정확성과 전이성을 향상시키는 새로운 약한 지도 학습 프레임워크를 제안합니다.

Rabab Alkhalifa2026-03-06💻 cs

Context-Dependent Affordance Computation in Vision-Language Models

본 논문은 대규모 계산을 통해 비전 - 언어 모델 (VLM) 이 다양한 에이전트 페르소나와 상황적 프라임에 따라 물체의 affordance(행동 가능성) 를 계산할 때 어휘적 및 의미적 수준에서 현저한 편차를 보이며, 이는 고정된 세계 모델링이 아닌 동적이고 질의에 의존적인 온톨로지 투영 (JIT Ontology) 이 로봇 공학 연구에 필요함을 시사한다고 주장합니다.

Murad Farzulla2026-03-06💻 cs

Do Mixed-Vendor Multi-Agent LLMs Improve Clinical Diagnosis?

이 논문은 서로 다른 벤더의 대형 언어 모델로 구성된 다중 에이전트 시스템이 단일 벤더 시스템보다 임상 진단 정확도와 재현율에서 우수한 성능을 보이며, 이는 상호 보완적인 유추 편향을 결합하여 개별 모델이 놓친 정확한 진단을 도출하기 때문임을 RareBench 및 DiagnosisArena 벤치마크를 통해 입증했습니다.

Grace Chang Yuan, Xiaoman Zhang, Sung Eun Kim + 1 more2026-03-06💻 cs

A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

본 논문은 200,000 건 이상의 논문과 40 만 줄의 CFD 코드로 구축된 대규모 멀티모달 지식 베이스와 엄격한 평가 벤치마크를 기반으로, 단순한 RAG 의 한계를 극복하고 구조화된 지식 그래프와 계속된 사전 학습을 통해 연소 과학 분야에 특화된 대형 언어 모델을 개발하는 통합 프레임워크를 제시합니다.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs