The Third Ambition: Artificial Intelligence and the Science of Human Behavior
이 논문은 생산성과 정렬에 이어 인공지능 연구의 세 번째 목표로서, 대규모 언어 모델을 인간 행동과 문화, 도덕적 추론을 연구하는 과학적 도구로 활용하는 새로운 패러다임을 제시하고 그 방법론과 한계를 탐구합니다.
1071 편의 논문
이 논문은 생산성과 정렬에 이어 인공지능 연구의 세 번째 목표로서, 대규모 언어 모델을 인간 행동과 문화, 도덕적 추론을 연구하는 과학적 도구로 활용하는 새로운 패러다임을 제시하고 그 방법론과 한계를 탐구합니다.
이 논문은 다국어 텍스트 분류에서 노이즈와 도메인 이동이 있는 환경의 불확실성 추정 방법을 평가한 결과, 소프트맥스 기반 방법은 한계가 있지만 몬테카를로 드롭아웃이 모든 언어와 조건에서 더 강력한 보정 능력과 예측 신뢰성을 제공함을 입증했습니다.
이 논문은 다국어 문장 난이도 감지 작업에서 BERT 기반 모델이 노이즈에 어느 정도 내재적 강건성을 갖지만, GMM 기반 노이즈 필터링과 같은 명시적 노이즈 제거 기법을 적용하면 소규모 데이터셋에서 성능이 크게 향상됨을 입증하고, 이를 통해 가장 큰 규모의 다국어 문장 난이도 예측 코퍼스를 공개했습니다.
이 논문은 러시아어 화자의 영어 작문에서 모국어 간섭 오류를 탐지하고 생성하기 위해 전문가 주석 데이터와 강화 학습 기반의 증강 기법을 결합한 대규모 데이터셋 RILEC 을 제안하고, 이를 통해 모델의 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 카테고리 이론의 함자 (functor) 기반 변환과 검색 증강 생성 (RAG) 을 결합하여 대규모 언어 모델의 편향을 구조적으로 제거하고 맥락적 정확성을 확보함으로써 공정한 출력을 도출하는 통합 프레임워크를 제안합니다.
이 논문은 저자원 언어와 도메인별 기계 번역 품질 평가를 위해 오픈 가중치 LLM 에 중간 레이어 적응 기법 (ALOPE 및 LoRMA) 을 적용함으로써 프롬프트 기반 방법의 한계를 극복하고 견고한 품질 추정 성능을 달성하는 방안을 제시합니다.
이 논문은 자율적 의사결정 시스템으로서의 에이전트 기반 검색 증강 생성 (Agentic RAG) 을 체계화하기 위해 수학적 형식화, 통합 분류 체계, 평가 방법론의 한계 및 시스템적 위험 분석을 제시하고, 향후 신뢰성 있는 시스템 구축을 위한 연구 방향을 제시합니다.
이 논문은 동적으로 변화하는 지식 스트림에 실시간으로 적응하는 대규모 언어 모델의 능력을 평가하기 위해 'OAKS'라는 새로운 벤치마크를 제안하고, 기존 최첨단 모델 및 에이전트 메모리 시스템이 상태 추적 지연과 주의 분산 문제로 인해 이러한 적응에 심각한 한계를 보임을 규명합니다.
이 논문은 모호한 시각적 질문에 대한 전략적 응답 생성을 위해 모호성 수준을 세분화한 새로운 데이터셋 AQuA 를 제안하고, 이를 통해 학습된 비전 - 언어 모델이 모호성을 인식하고 상황에 맞는 응답 전략을 선택하여 기존 모델들을 능가하는 성능을 입증합니다.
이 논문은 모바일 GUI 에이전트의 일반화 능력을 평가하기 위한 새로운 벤치마크 'AndroidWorld-Generalization'과 확장 가능한 RL 학습 시스템을 제안하고, 그룹 상대적 정책 최적화 (GRPO) 를 적용한 실험을 통해 일반화 문제의 현재 한계와 잠재력을 규명했습니다.
이 논문은 파인튜닝 중 안전 관련 토큰의 신뢰도만 참조 모델과 일치하도록 제한하는 'PACT' 프레임워크를 제안하여, 모델의 유용성을 해치지 않으면서도 안전 정렬의 붕괴를 방지하는 방법을 제시합니다.
이 논문은 이기종 데이터베이스 시스템의 각기 다른 SQL 문법과 제약 조건을 고려하여 자연어에서 실행 가능한 SQL 쿼리를 생성하는 지식 기반 프레임워크 'Dial'을 제안하고, 논리적 쿼리 계획, 계층적 지식 베이스, 실행 기반 디버깅 루프를 통해 기존 방법론 대비 번역 정확도와 기능 커버리지를 크게 향상시켰음을 보여줍니다.
이 논문은 VAE, GAN, 흐름 기반, 자기회귀 및 트랜스포머, 확산 모델 등 지난 10 년간 발전한 이미지 생성 모델들의 기술적 역사와 최적화 기법, 한계를 체계적으로 정리하고, 최근의 비디오 생성 기술과 딥페이크 위험, 탐지, 워터마킹 등 책임 있는 배포에 대한 중요성을 다루고 있습니다.
이 논문은 어텐션과 피드포워드 네트워크를 각각 토큰 스트림과 컨텍스트 스트림으로 분리하여 해석 가능성과 성능 사이의 조절 가능한 균형을 제공하는 '듀얼-스트림 트랜스포머' 아키텍처를 제안하고, 이를 통해 내부 구조가 설계 단계에서 노출되는 해석 가능한 언어 모델의 기반을 마련했다고 요약할 수 있습니다.
이 논문은 언어 모델이 시각적 단서가 전혀 없는 상황에서도 언어적 단서와 범주 내 시각적 유사성을 기반으로 이미지 객체의 상위개념을 추론할 수 있는 교차모달 일반화 능력을 보유하고 있음을 보여줍니다.
이 논문은 확산 언어 모델이 자기회귀 모델과 달리 계층적 표현 구조와 초기 층의 중복성을 가지며, 이를 활용한 정적 계층 건너뛰기 기법으로 추가적인 구조 변경 없이 추론 시 연산량을 18.75%까지 줄이면서도 성능을 유지할 수 있음을 보여줍니다.
이 논문은 임상 텍스트의 개념 인식, 주장 분류, 관계 추출이라는 세 가지 태스크를 독립적인 파이프라인 방식이 아닌 단일 엔드투엔드 신경망 모델로 통합하여 최적화함으로써 기존 파이프라인 기반 접근법보다 성능을 크게 향상시키는 새로운 공동 베이스라인을 제안합니다.
이 논문은 카슈미르어 화자 약 700 만 명을 위한 최초의 오픈소스 신경망 TTS 시스템인 'Bolbosh'를 제안하며, 오프트멀 트랜스포트 조건부 흐름 매칭 (OT-CFM) 과 스크립트 인식 적응 전략을 통해 저자원 언어의 텍스트 음성 변환 성능을 획기적으로 개선했음을 보여줍니다.
이 논문은 할루시네이션을 완화하기 위해 기억 기반 계획 가지치기, 신뢰도 기반 행동 정제, 이중 가중치 궤적 집계라는 불확실성 인식 추론 프레임워크를 도입하여 기존 TableMind 의 한계를 극복하고 테이블 추론 성능을 획기적으로 향상시킨 'TableMind++'를 제안합니다.
이 논문은 비원어민 발화 데이터 없이도 타 언어의 네이티브 발화 기반 미세 조정과 태스크 벡터 계산을 통해 다국어 TTS 시스템에서 억양 강도와 혼합을 정밀하게 제어할 수 있는 'Accent Vector'를 제안합니다.