From We to Me: Theory Informed Narrative Shift with Abductive Reasoning
이 논문은 사회적 과학 이론과 귀납적 추론을 기반으로 한 신경-상징적 접근법을 제안하여, 기존 대규모 언어 모델이 수행하기 어려운 '우리'에서 '나'로의 서사 전환 과제를 성공적으로 해결하고 원본 메시지의 충실도를 유지하면서도 서사적 일관성을 크게 향상시켰음을 보여줍니다.
1737 편의 논문
이 논문은 사회적 과학 이론과 귀납적 추론을 기반으로 한 신경-상징적 접근법을 제안하여, 기존 대규모 언어 모델이 수행하기 어려운 '우리'에서 '나'로의 서사 전환 과제를 성공적으로 해결하고 원본 메시지의 충실도를 유지하면서도 서사적 일관성을 크게 향상시켰음을 보여줍니다.
이 논문은 인간 평가 패턴과 부합하는 형식적 속성과 독립성 제약을 적용하여 지시 사항을 유형별 술어로 자동 분해하고 만족도를 평가하는 대화형 LLM 지시 수행 평가 프레임워크인 DIALEVAL 을 제안하며, 이를 통해 기존 방법 대비 오류를 26.45% 줄이고 인간 판단과의 상관관계를 크게 향상시켰음을 보여줍니다.
이 논문은 기존 벤치마크의 데이터 오염 및 정적 한계를 극복하기 위해, 12 개의 생물의학 하위 분야를 매달 업데이트하며 최신 LLM 의 새로운 지식 발견 능력을 평가하는 동적 자동화 프레임워크인 'DBench-Bio'를 제안하고 그 유효성을 검증합니다.
이 논문은 안전성 정렬 과정에서 발생하는 과도한 거절 (over-refusal) 문제를 해결하기 위해, 실제 유해한 콘텐츠와 겉보기에 유해한 콘텐츠를 명확히 구분하는 '대조적 정제 (Contrastive Refinement)' 기법을 도입하여 모델의 유용성과 안전성을 동시에 향상시키는 새로운 정렬 단계를 제안합니다.
이 논문은 대규모 언어 모델의 스타일 속성이 활성화 공간의 선형 방향으로 인코딩된다는 가설을 실험적으로 입증하고, 이를 기반으로 학습 없이도 정밀한 스타일 제어와 안전성 향상을 가능하게 하는 경량화 방법을 제시합니다.
이 논문은 사용자의 상황적 맥락과 축적된 의도 패턴을 검색 기반 추론을 통해 결합하여 개인화된 의도 이해를 수행하는 프록시 에이전트 'IntPro'를 제안하고, 이를 통해 다양한 시나리오에서 강력한 성능을 입증합니다.
이 논문은 추론 시 모델 파라미터를 업데이트하지 않고도 Sequential Adaptive Steering(SAS) 기법을 통해 여러 성격 요소를 동시에 제어하고 설명 가능한 다차원 성격 프로파일을 생성할 수 있는 모듈형 프레임워크를 제안합니다.
이 논문은 대화 중 사용자의 만족도, 감정 인식, 그리고 감정 상태 전이 예측을 동시에 수행할 수 있도록 다중 태스크 및 다중 레이블로 구성된 새로운 한국어 대화 데이터셋을 구축하여 기존 데이터의 부족과 단일 턱 대화의 한계를 해결했습니다.
이 논문은 언어 모델의 잔여 스트림 (residual stream) 내 의미 표현을 기반으로 최대 신장 트리를 구축하여 레이어 간 구조적 유사성을 정량화하는 분석 프레임워크 'StructLens'를 제안하고, 기존 코사인 유사도와 구별되는 구조적 패턴을 발견하여 레이어 가지치기 등 실제 과제에 유용함을 입증합니다.
이 논문은 작은 규모의 LLM 이 환경 피드백을 통해 자동으로 코드 하네스나 전체 정책을 생성함으로써, 더 큰 모델보다 불법 행동을 방지하고 더 높은 보상을 얻으며 비용 효율성을 입증하는 'AutoHarness' 기법을 제안합니다.
이 논문은 LLM 이 상호작용적 환경에서 불확실성이나 모순된 지적에 어떻게 반응하는지 평가하는 '확신 강인성 (Certainty Robustness)' 벤치마크를 제안하고, 기존 정확도 지표만으로는 설명되지 않는 모델별 안정성과 적응성 차이를 규명했습니다.
이 논문은 15 개 공개 데이터 소스를 통합하여 131 만 개의 PPG 신호와 315 만 개의 질문 - 답변 쌍으로 구성된 대규모 PPG-텍스트 데이터셋 'PulseLM'을 제안하고, 이를 통해 생리학적 추론 및 멀티모달 기초 모델 연구를 위한 표준화된 벤치마크를 확립합니다.
본 논문은 13 개의 다양한 크기의 대규모 언어 모델을 대상으로 수학적 추론 작업에서 중간 추론 단계에 가해진 5 가지 유형의 교란 (MathError, UnitConversion 등) 이 모델 성능에 미치는 영향을 실증적으로 분석하여, 교란 유형과 모델 규모에 따라 취약성이 이질적으로 나타난다는 사실을 규명했습니다.
이 논문은 타겟 모델의 예측 분포와 드래프트 토큰을 일치시키기 위해 LM 헤드의 몬테카를로 드롭아웃을 활용한 훈련 불필요한 DropMatch 방법을 제안하여, 기존 추론 가속화 기법과 결합 시 최대 1.33 배의 추론 속도 향상을 달성함을 보여줍니다.
이 논문은 대학원 수준의 선형대수, 수치최적화, 벡터 미적분, 확률 및 과학적 컴퓨팅을 다루는 1,500 개의 전문가 제작 객관식 문제로 구성된 새로운 벤치마크 데이터셋 'CompMath-MCQ'를 소개하고, 이를 통해 최신 대규모 언어 모델 (LLM) 의 고급 계산 수학 추론 능력이 여전히 큰 도전 과제로 남아 있음을 보여줍니다.
이 논문은 트랜스포머 기반 대규모 언어 모델에서 다양한 능력이 소수의 어텐션 헤드에 국한되어 존재한다는 것을 발견하고, 압축 센싱 기법을 활용해 이러한 기능적 구성 요소를 효율적으로 식별하는 방법을 제시합니다.
본 논문은 대규모 언어 모델의 순위 추정에 내재된 불확실성을 정량화하고, 컨텍스트에 따른 성능 변동을 고려하여 통계적으로 유의미한 순위만 식별하는 '결정 안전성 (decision-safe)' 프레임워크를 제안합니다.
이 논문은 인터넷 연결이 제한된 교육 환경을 위해 저사양 CPU 장치에서 완전히 오프라인으로 작동하며 자동 하드웨어 인식 모델 선택과 교육적 응답 제어를 통해 디지털 격차를 해소하는 '아라파이 (Arapai)'라는 AI 챗봇 아키텍처를 제안하고 그 유효성을 검증합니다.
이 논문은 인과적 및 프로빙 기반 해석 기법을 활용하여 Llama 기반 생의학 언어 모델에서 약물군 지식이 단일 토큰이 아닌 분산된 표현으로 인코딩되며, 특히 중간 토큰과 합계 풀링된 표현에서 가장 강력하게 나타남을 규명했습니다.
이 논문은 LLM 이 OOD(분포 외) 입력의 난이도가 증가함에 따라 마지막 은닉 상태의 표현이 희소해지며, 이를 활용한 '희소성 기반 커리큘럼 인-컨텍스트 학습 (SG-ICL)' 전략을 통해 모델의 성능을 크게 향상시킬 수 있음을 규명합니다.