What Triggers my Model? Contrastive Explanations Inform Gender Choices by Translation Models
이 논문은 대조적 설명을 통해 기계 번역 모델이 성별을 선택하는 데 영향을 미치는 소스 문장의 입력 토큰을 분석하고, 인간의 성별 인식과 모델의 할당 패턴 간의 유사성을 규명하여 성별 편향을 완화하는 데 기여합니다.
1726 편의 논문
이 논문은 대조적 설명을 통해 기계 번역 모델이 성별을 선택하는 데 영향을 미치는 소스 문장의 입력 토큰을 분석하고, 인간의 성별 인식과 모델의 할당 패턴 간의 유사성을 규명하여 성별 편향을 완화하는 데 기여합니다.
이 논문은 기존 AI 의 모호성 조기 해소 한계를 극복하기 위해, 다중 벡터 임베딩과 비-수렴 어텐션 등을 통해 모호성을 유지하고 맥락에 따른 정체성을 보존하는 '비해석 추론 (NRR)' 프레임워크를 제안합니다.
이 논문은 네 가지 주요 대규모 언어 모델 (LLM) 을 정치, 이념, 동맹, 언어, 성별 차원에서 체계적으로 분석한 결과, 모델이 중립적으로 정렬되어 있음에도 불구하고 다양한 형태의 편향과 경향을 여전히 드러낸다는 점을 밝혔습니다.
이 논문은 확률적 추론을 테스트베드로 활용하여 RLVR(검증 가능한 보상을 통한 강화학습) 이 초기 추론 역량이 충분한 모델에서 복잡한 인과적 추론 과제의 일반화 성능을 향상시킨다는 것을 실증적으로 규명했습니다.
이 논문은 대규모 멀티테넌트 검색 환경에서 자동화된 파이프라인을 통해 데이터셋을 구축하고, 문서 인덱스를 재구성하지 않고 쿼리 인코더만 효율적으로 미세 조정하는 'DevRev-Search' 프레임워크를 제안하여 확장 가능한 검색 적응을 가능하게 합니다.
이 논문은 지식 그래프를 암시적 보상 모델로 활용하여 axiomatic 사실을 기반으로 한 하향식 학습 파이프라인을 제안함으로써, 복잡한 다단계 추론에서 기존 최첨단 모델들을 능가하는 구성적 추론 능력을 달성했음을 보여줍니다.
이 논문은 모호한 입력에 대한 LLM 의 조기 의미 확정 (collapse) 을 방지하고 여러 해석을 공존시키는 비-해결 추론 (NRR) 프레임워크를 구현하기 위해, 텍스트를 비-축퇴 상태 공간으로 매핑하는 'NRR-Phi'라는 형식적 체계와 하이브리드 추출 파이프라인을 제안합니다.
이 논문은 시간 기반 질문 응답에서 불확실성을 인정하고 답변을 유보하는 능력을 학습시키기 위해 체인 오브 씽킹 (CoT) 감독과 유보 인식 보상을 활용한 강화 학습 (RL) 파이프라인을 제안하고, 이를 통해 기존 모델보다 정확도와 신뢰성을 크게 향상시켰음을 실증적으로 보여줍니다.
이 논문은 RLVR 기반 강화학습에서 발생하는 그라디언트 할당 문제를 해결하기 위해 보상을 스칼라 가중치가 아닌 분류 레이블로 재해석한 'REAL' 프레임워크를 제안하며, 이를 통해 수학 추론 벤치마크에서 GRPO 및 DAPO 등 기존 최첨단 방법들보다 뛰어난 성능과 안정성을 입증했습니다.
이 논문은 마스크된 확산 언어 모델의 반복적 샘플링 과정에서 수렴된 토큰 위치를 잠그고 (SureLock) 해당 위치의 연산을 생략하여 계산 비용을 획기적으로 줄이면서도 생성 품질을 유지하는 효율적인 방법을 제안합니다.
본 논문은 수학이나 코딩과 같은 형식적 추론에서 뛰어난 성능을 보이는 대형 추론 모델 (LRM) 이도 이론적 마음 (ToM) 과제에서는 오히려 성능이 저하되거나 선택지 매칭에 의존하는 등 기존 추론 방식만으로는 사회적 추론 능력을 확보하기 어렵다는 점을 규명하고, 이를 해결하기 위한 적응형 추론 및 단축 방지 기법을 제안합니다.
이 논문은 마인츠 방언인 '미엔처리시'를 위한 최초의 NLP 연구로, 사전 구축과 실험을 통해 최신 대규모 언어 모델이 해당 방언의 정의 생성 및 단어 생성에서 극도로 낮은 성능을 보임을 입증하고, 방언 보존을 위한 추가 자원과 연구의 필요성을 강조합니다.
이 논문은 의견 용어 주석이 포함된 새로운 식당 도메인 Czech ABSA 데이터셋을 제안하고, 이를 통해 다양한 언어 설정에서 대규모 언어 모델을 평가하며 번역 및 레이블 정렬 방법을 통해 저자원 언어의 교차 언어 과제를 해결하는 방안을 제시합니다.
이 논문은 저자원 의료 환경 배포를 위해 소규모 오픈소스 LLM 들의 프롬프트 민감도와 답변 일관성을 평가한 결과, 일관성이 높다고 해서 정확도가 보장되는 것은 아니며, 특히 역할극 프롬프트는 정확도를 저하시키고 도메인 사전학습만으로는 지시 준수가 어렵다는 점을 밝혀 Llama 3.2 가 정확성과 신뢰성 측면에서 가장 균형 잡힌 성능을 보였음을 제시합니다.
이 논문은 기존 제로샷 관계 추출 모델이 대규모 문서 검색 및 불필요 입력 거절과 같은 현실적 제약 하에서 취약함을 지적하고, 이를 개선하기 위한 단일 패스 모델 및 거절 메커니즘을 제안하며 AlignRE 가 가장 우수한 성능을 보임을 입증합니다.
이 논문은 대규모 언어 모델 기반 작업 대화 시스템에서 기존 공격 기법의 한계를 극복하고 대화 상태 레이블을 높은 정밀도로 추출할 수 있는 새로운 데이터 추출 공격 기법을 제안하며, 이를 통해 학습 데이터의 기억 현상을 체계적으로 분석하고 완화 전략을 논의합니다.
이 논문은 정성적 콘텐츠 분석 원리를 통합하여 인플레이션 서사를 방향성 비순환 그래프 (DAG) 로 주석하고, 다양한 표현 방식과 거리 척도가 주석자 간 일치도에 미치는 영향을 분석함으로써 인간 라벨 변이 하의 그래프 기반 서사 주석 품질 향상을 위한 실용적 지침을 제시합니다.
이 논문은 AI 생성 에세이 탐지기의 현황과 책임 있는 사용 가이드라인을 제시하고, GRE 쓰기 프롬프트를 기반으로 한 실증 분석을 통해 특정 LLM 으로 훈련된 탐지기가 다른 LLM 에서 생성된 에세이를 얼마나 잘 일반화하여 식별하는지 평가하여 실용적 적용을 위한 지침을 제공합니다.
이 논문은 LLM 시대에 TeX 의 한계를 분석하고, 더 효율적인 데이터 구조와 렌더링을 제공하는 WYSIWYG 구조화 편집기인 Mogan STEM 과 그 문서 형식 (.tmu) 이 컴파일 성능 향상과 LLM 미세조정 효율성 증대 측면에서 TeX 보다 우월함을 실험을 통해 입증하며, 향후 .tmu 형식을 활용한 대규모 LLM 학습 실험을 촉구합니다.
이 논문은 생성 및 평가 에이전트 간의 '제안 - 평가 - 수정' 협업 프로세스와 강화 학습을 통해 제로샷 문서 수준 이벤트 인자 추출의 데이터 생성 품질과 추출 성능을 동시에 향상시키는 다중 에이전트 협업 프레임워크를 제안합니다.