EDDA-Coordinata: An Annotated Dataset of Historical Geographic Coordinates
이 논문은 18 세기 프랑스 백과전서에서 추출한 지리적 좌표의 정밀한 주석 데이터셋 (EDDA-Coordinata) 을 구축하고 이를 기반으로 학습된 트랜스포머 모델을 통해 고전 텍스트에서 좌표를 자동으로 추출 및 정규화하는 두 단계의 방법을 제안하며, 이를 다양한 언어와 도메인에서 검증한 결과를 제시합니다.
2680 편의 논문
이 논문은 18 세기 프랑스 백과전서에서 추출한 지리적 좌표의 정밀한 주석 데이터셋 (EDDA-Coordinata) 을 구축하고 이를 기반으로 학습된 트랜스포머 모델을 통해 고전 텍스트에서 좌표를 자동으로 추출 및 정규화하는 두 단계의 방법을 제안하며, 이를 다양한 언어와 도메인에서 검증한 결과를 제시합니다.
이 논문은 대규모 언어 모델의 기억 시스템이 감정 정보를 처리하는 데 있어 한계가 있음을 규명하기 위해 감정 정보 추출, 업데이트, 질문 응답의 세 가지 차원을 평가하는 새로운 벤치마크와 HLME 데이터셋을 제안하고 있습니다.
이 논문은 언어 모델의 사실적 및 반사실적 기울기를 기반으로 특징 방향을 학습하는 오픈소스 파이썬 패키지 'GRADIEND'를 소개하며, 데이터 생성부터 모델 재작성 및 평가에 이르는 통합 워크플로우를 제시합니다.
이 논문은 유튜브의 자동 자막 시스템이 단일 스페인어 옵션만 제공함으로써 특정 방언과 성별에 따라 편향된 성능 차이를 보이며, 디지털 플랫폼의 알고리즘이 사용자의 다양성을 반영하도록 보정되어야 함을 입증합니다.
이 논문은 인간 피드백의 한계로 인한 보상 모델의 인식적 불확실성을 체계적으로 평가하고 비교하기 위해 'RewardUQ'라는 통합 프레임워크를 제안하며, 모델 크기와 초기화가 성능에 가장 큰 영향을 미친다는 사실을 규명하고 오픈소스 패키지를 공개합니다.
이 논문은 디지털 트윈과 기계 학습을 결합한 데이터 기반 파이프라인을 통해 분산 LLM 어댑터 서빙 환경에서 요청 starvation 과 GPU 메모리 오류를 방지하면서 목표 워크로드를 지원하는 데 필요한 GPU 수를 최소화하여 효율성을 극대화하는 방법을 제안합니다.
이 논문은 추론 기능이 감정 분석 과제의 복잡도에 따라 성능에 상반된 영향을 미쳐 단순 작업에서는 오히려 성능을 저하시키지만 복잡한 작업에서는 향상시킨다는 것을 실증적으로 보여주며, 계산 비용 대비 효율성을 고려할 때 추론은 단순 작업보다는 복잡한 감정 인식 과제에 한정적으로 유용함을 밝힙니다.
이 논문은 기존 LLM 기반 에이전트들이 해결하지 못했던 결제 업무의 자동화 과제를 해결하기 위해, 대화형 결제 에이전트부터 감독 및 라우팅 에이전트까지의 계층적 구조를 통해 종단 간 결제 워크플로우를 구현한 최초의 다중 에이전트 시스템인 HMASP 를 제안하고 그 타당성을 입증합니다.
이 논문은 고대 중국 송사 (SongCi) 음악의 리듬과 스타일을 복원하기 위해 고안된 최초의 음악 생성 모델 '송송 (SongSong)'과 대규모 데이터셋 'OpenSongSong'을 소개하며, 기존 모델들보다 우수한 성능을 입증합니다.
이 논문은 동일한 입력 프롬프트에 대한 서로 다른 응답을 사용하는 선호도 최적화 (DPO 등) 훈련 시 중복 프롬프트의 어텐션 연산과 KV 캐시 메모리 사용을 줄여 훈련 시간을 최대 37% 단축하고 기존 최적화 기법과 결합 시 3.22 배의 속도 향상을 이루는 '선호도 패킹 (Preference Packing)' 기법을 제안합니다.
이 논문은 온라인 논쟁에서 서사적 요소가 설득에 미치는 영향을 분석하기 위해 'ARGUS'라는 새로운 프레임워크와 'ChangeMyView' 코퍼스를 소개하며, 이를 통해 설득 성공에 영향을 미치는 구체적인 서사적 특성을 규명합니다.
이 논문은 RLVR 환경에서 부분적으로 올바른 추론 경로를 폐기하지 않고 프로세스 보상 모델을 활용해 첫 번째 오류 단계를 정밀하게 수정함으로써 탐색 다양성을 확보하고 수학 및 일반화 추론 성능을 획기적으로 개선하는 새로운 프레임워크 'SCOPE'를 제안합니다.
이 논문은 비전-언어 모델이 생성한 방사선 보고서의 논리적 일관성을 보장하기 위해, 자유 텍스트를 구조화된 명제로 자동 형식화하고 SMT 솔버를 활용해 임상적 추론의 오류를 검증하는 신경기호적 검증 프레임워크를 제안합니다.
이 연구는 고대 그리스어 전문 텍스트 번역에서 LLM 의 성능이 전문 용어의 희소성에 의해 결정되며, 특히 미번역된 약학 텍스트에서 용어 빈도가 번역 실패를 강력하게 예측한다는 것을 인간 평가와 자동 지표를 통해 입증했습니다.
이 논문은 RAG 시스템에서 복잡한 시각 문서 처리 시 발생하는 과도한 컨텍스트와 할루시네이션 문제를 해결하기 위해, 문서 레이아웃을 분석하여 필요한 영역만 동적으로 추출하는 새로운 패러다임인 AgenticOCR 을 제안합니다.
이 논문은 인간의 의사결정에 대한 신뢰할 수 있는 설명과 논쟁을 가능하게 하는 대규모 언어 모델 기반의 논증적 추론 시스템인 'ArgLLM-App'을 소개하며, 이는 시각화 기능과 외부 신뢰 출처 연동, 모듈형 설계를 통해 사용자와의 상호작용을 지원합니다.
이 논문은 SLM 의 추론 효율성을 높이기 위해 파인튜닝 시 토크나이저 어휘를 확장하는 TASC-ft 와 추가 학습 없이 작업별 n-gram 기반의 추측적 디코딩을 수행하는 TASC-spec 로 구성된 TASC 프레임워크를 제안합니다.
이 논문은 비공개 정보를 공유하는 협력 게임을 통해 다중 턴 상호작용을 평가하는 'MT-PingEval'을 제안하며, 최신 언어 모델이 비대화식 기준보다 협력적 대화를 통해 성능을 향상시키지 못하고 인간보다 일관성 있는 대화와 토큰 효율성을 보여주지 못한다는 사실을 규명했습니다.
이 논문은 외부 도구나 추가 학습 없이 MLLM 의 내부 모달리티 특징만을 활용하여 샘플 응답의 불일치 조정 시맨틱 볼륨을 계산함으로써 다양한 모달리티와 작업에서 기존 방법보다 우수한 불확실성 정량화 성능을 보이는 새로운 프레임워크인 UMPIRE 를 제안합니다.
이 논문은 추론 과정의 지시 따르기 능력을 향상시키는 파인튜닝과 추론 및 답변 생성을 분리하는 전략을 통해, 민감한 정보 유출을 방지하면서도 추론 모델의 프라이버시 보호 성능을 획기적으로 개선할 수 있음을 보여줍니다.