CTRL-RAG: Contrastive Likelihood Reward Based Reinforcement Learning for Context-Faithful RAG Models
이 논문은 외부 보상의 한계를 극복하고 환각을 방지하기 위해 지지 증거 유무에 따른 로그 가능도 차이를 최적화하는 대비적 가능도 보상 (CLR) 을 중심으로 한 하이브리드 보상 프레임워크를 제안하여 RAG 모델의 문맥 충실도를 향상시키는 방법을 제시합니다.
1723 편의 논문
이 논문은 외부 보상의 한계를 극복하고 환각을 방지하기 위해 지지 증거 유무에 따른 로그 가능도 차이를 최적화하는 대비적 가능도 보상 (CLR) 을 중심으로 한 하이브리드 보상 프레임워크를 제안하여 RAG 모델의 문맥 충실도를 향상시키는 방법을 제시합니다.
본 논문은 유해한 데이터만으로도 문맥적 트리거가 존재할 때만 유해 행동을 보이고 트리거가 없을 때는 안전을 유지하는 '의미론적 격리' 현상이 발생함을 실험을 통해 입증함으로써, benign 데이터의 혼합 없이도 트리거 기반의 유해 미세조정 자체가 치명적인 안전 취약점을 야기할 수 있음을 규명했습니다.
이 논문은 다윈의 '밈' 개념을 도입하여 모델과 데이터의 상호작용을 '지각 행렬'로 분석하는 '밈 탐지' 패러다임을 제시함으로써, 기존 평가 방식이 놓친 LLM 의 복잡한 행동 특성과 숨겨진 능력 구조를 포착할 수 있는 새로운 평가 체계를 제안합니다.
이 논문은 23,404 명의 다양한 인구통계학적 배경을 가진 참가자들과의 자연스러운 대화를 기반으로 한 HUMAINE 프레임워크를 통해 대규모 언어 모델의 인간 선호도를 다차원적으로 평가하고, 모델 성능의 위계와 연령에 따른 선호도 이질성, 그리고 평가 차원별 판별력 차이를 규명했습니다.
이 논문은 영어 중심의 기존 평가 한계를 극복하고 아랍어 언어 모델의 안전성을 체계적으로 평가하기 위해 MLCommons 안전 해저드 분류에 기반한 12 개 범주의 8,170 개 프롬프트로 구성된 'SalamahBench'를 제안하고, 이를 통해 다양한 아랍어 모델의 안전성 편차를 분석하고 전용 안전 장치가 필요함을 입증합니다.
이 논문은 각 토큰의 의미에 따라 압축률을 동적으로 할당하여 기존 방법들보다 높은 압축 비율에서도 우수한 성능을 유지하는 새로운 KV 캐시 압축 프레임워크인 DynaKV 를 제안합니다.
이 논문은 대규모 언어 모델의 복잡한 동역학을 고차 마르코프 과정의 조합적 폭발을 완화하는 가산 다단계 마르코프 체인으로 근사화하고, 이를 단계별 기억 함수 체인과 동등하게 연결하여 '정보 온도' 개념을 확장 적용하는 이론적 프레임워크를 제시합니다.
이 논문은 LLM 이 생성한 텍스트 요약의 의미 평가에 통계적 유사도 이상의 해석적 접근이 필요함을 주장하며, 기호학과 해석학을 기반으로 한 새로운 정성적 평가 지표인 '유도 개념 평가 (ICR)'를 제안하고 이를 통해 LLM 이 인간보다 문맥적 의미 정확도에서 미흡함을 실증적으로 분석했습니다.
이 논문은 RoBERTa 임베딩과 확장된 그래프 합성곱 네트워크를 결합하여 온톨로지 기반의 주의를 도입한 'RoBERTa-OTA' 모델을 제안함으로써, 사회 미디어의 다중 클래스 혐오 표현 탐지 정확도를 기존 방법론 대비 유의미하게 향상시켰음을 보여줍니다.
이 논문은 'Dual Tuning' 프레임워크를 통해 다양한 멀티모달 작업에서 추론의 유익성을 정량화하고 '생각의 경계 (Thinking Boundary)'를 설정함으로써, 모든 작업에 무조건적인 추론을 적용하는 관행에 도전하고 데이터 및 학습 전략을 최적화하는 실용적인 지침을 제시합니다.
이 논문은 아랍어 소셜 미디어의 프레임 감지 문제를 해결하기 위해, 다중 에이전트 LLM 파이프라인을 통해 신뢰도 신호를 추출하고 이를 QUBO 기반의 데이터 선별에 활용하여 아랍어 감정 예측의 정확성과 전이성을 향상시키는 새로운 약한 지도 학습 프레임워크를 제안합니다.
본 논문은 LLM 을 자동 평가자로 활용할 때 동일한 입력에도 모델, 온도 설정, 평가 기준에 따라 점수 일관성이 크게 달라질 수 있음을 실증적으로 분석하여, 기업 환경에서의 신뢰성 있는 도입을 위해 모니터링과 인간-LLM 하이브리드 평가 전략의 필요성을 강조합니다.
본 논문은 대규모 계산을 통해 비전 - 언어 모델 (VLM) 이 다양한 에이전트 페르소나와 상황적 프라임에 따라 물체의 affordance(행동 가능성) 를 계산할 때 어휘적 및 의미적 수준에서 현저한 편차를 보이며, 이는 고정된 세계 모델링이 아닌 동적이고 질의에 의존적인 온톨로지 투영 (JIT Ontology) 이 로봇 공학 연구에 필요함을 시사한다고 주장합니다.
이 논문은 서로 다른 벤더의 대형 언어 모델로 구성된 다중 에이전트 시스템이 단일 벤더 시스템보다 임상 진단 정확도와 재현율에서 우수한 성능을 보이며, 이는 상호 보완적인 유추 편향을 결합하여 개별 모델이 놓친 정확한 진단을 도출하기 때문임을 RareBench 및 DiagnosisArena 벤치마크를 통해 입증했습니다.
이 논문은 IMO 의 표준 해상 통신 어구 (SMCP) 를 준수하는 현실적인 해상 무전 대화를 생성하기 위해 자기 지시 (Self-Instruct) 방법론과 26 단계 검증 파이프라인을 통합하고, LoRA 를 통해 계산 효율성을 높인 AI 기반 해양 안전 솔루션을 제안합니다.
이 논문은 LLM 출력의 품질을 평가할 때 주관적인 수치 점수 대신 '무엇이 부족한지'에 대한 자연어 피드백과 임베딩 유사도를 기반으로 한 해석 가능한 WIM(WIM) 평가 시스템을 제안하여, 기존 선호도 학습 파이프라인에 통합 가능한 더 명확하고 학습 신호가 풍부한 평가 방식을 제시합니다.
본 논문은 다양한 LLM 의 특성과 비용에 따라 쿼리 복잡도를 동적으로 분석하여 최적의 모델을 선택하는 지능형 라우팅 및 캐스케이딩 기법들을 체계적으로 분류하고, 효율성과 성능을 극대화하기 위한 핵심 전략과 한계를 종합적으로 고찰합니다.
이 논문은 에이전트의 장기적 발전과 기술 전수를 위해 20 만 개 이상의 기술을 체계적으로 생성, 평가 및 연결하는 오픈 인프라 'SkillNet'을 제안하며, 이를 통해 에이전트의 성능을 크게 향상시키고 실행 단계를 줄인다는 것을 보여줍니다.
본 논문은 200,000 건 이상의 논문과 40 만 줄의 CFD 코드로 구축된 대규모 멀티모달 지식 베이스와 엄격한 평가 벤치마크를 기반으로, 단순한 RAG 의 한계를 극복하고 구조화된 지식 그래프와 계속된 사전 학습을 통해 연소 과학 분야에 특화된 대형 언어 모델을 개발하는 통합 프레임워크를 제시합니다.
이 논문은 추론 단계에서 수치적 불안정성을 극대화하는 손실 항을 최적화하여 생성된 이미지를 통해 기존 적대적 교란과 구별되는 새로운 방식으로 멀티모달 대규모 언어 모델의 성능을 심각하게 저하시킨다는 사실을 규명했습니다.