Statistical Machine Translation for Indic Languages
이 논문은 MOSES 툴킷과 Samanantar 및 OPUS 데이터를 활용하여 영어와 15 개의 저자원 인도어 간 통계적 기계 번역 (SMT) 모델을 개발하고, 다양한 전처리 기법과 구문 재배열 방식을 적용하여 BLEU, METEOR, RIBES 지표를 통해 번역 품질을 평가한 연구입니다.
2180 편의 논문
이 논문은 MOSES 툴킷과 Samanantar 및 OPUS 데이터를 활용하여 영어와 15 개의 저자원 인도어 간 통계적 기계 번역 (SMT) 모델을 개발하고, 다양한 전처리 기법과 구문 재배열 방식을 적용하여 BLEU, METEOR, RIBES 지표를 통해 번역 품질을 평가한 연구입니다.
이 논문은 의미 보존적 변형을 통해 텍스트 분류기의 취약점을 공격하는 방법을 체계적으로 검증하고, 허위 정보 감지 작업을 위한 새로운 벤치마크인 BODEGA를 제안하며, 최신 대규모 언어 모델이 기존 모델보다 오히려 더 취약할 수 있음을 실험적으로 증명합니다.
이 논문은 BERTimbau 를 활용하여 브라질 포르투갈어 AAC 시스템의 그림기호 예측을 위한 학습 코퍼스를 구축하고, 그림기호를 단어, 정의, 동의어 또는 이미지로 표현하는 다양한 방법을 평가하여 캡션 기반 표현이 가장 높은 정확도를 보임을 입증했습니다.
이 논문은 사전 학습된 대규모 언어 모델의 미세한 암시적 혐오 표현 이해 부족을 해결하기 위해, 표면적 의미와 암시적 의미를 가깝게 하고 클래스 간 거리를 넓히는 'FiADD'라는 새로운 프레임워크를 제안하여 여러 암시적 혐오 및 유사 과제의 성능을 크게 향상시켰음을 보여줍니다.
이 논문은 보도어 (Bodo) 를 위한 최초의 언어 모델인 BodoBERT 를 개발하고, 이를 BytePairEmbedding 과 결합한 앙상블 딥러닝 모델을 통해 보도어 품사 태깅 성능을 0.8041 의 F1 점수로 향상시켰으며, 같은 지역 언어인 아삼어와의 비교 실험을 수행했습니다.
이 논문은 ICLR 2024 등 주요 AI 컨퍼런스의 동료 검토 과정을 분석한 사례 연구를 통해, 제출된 리뷰 텍스트의 6.5%~16.9% 가 ChatGPT 와 같은 대규모 언어 모델에 의해 실질적으로 수정되거나 생성되었을 것으로 추정되며, 이는 특히 낮은 신뢰도를 가진 리뷰나 마감 임박 시에 더 두드러진다는 사실을 밝히고 있습니다.
이 논문은 대기만 수행하는 (Wait-Only) 비차단 브로드캐스트 프로토콜에서 상태 및 구성 커버가능성 문제가 기존에 알려진 Ackermann-하드에서 각각 P-완전과 PSPACE-완전으로 복잡도가 감소함을 증명합니다.
이 논문은 기존 워터마킹 기법의 한계를 극복하기 위해, 어휘를 주제별 토큰 집합으로 분할하여 의미적으로 정렬된 토큰을 '그린리스트'로 선택함으로써 생성 품질을 유지하면서 변형 공격에 강한 경량의 주제 기반 워터마킹 방식을 제안합니다.
이 논문은 영국 정치 관련 Reddit 토론을 분석하여 특정 '방아쇠 단어'가 언급될 때 참여도와 적대감이 증가하며 감정적 양극화가 심화된다는 인과관계를 규명했습니다.
이 논문은 전 세계 실제 식습관 데이터로 구성된 인간 검증 영양 추정 벤치마크 'NutriBench'를 소개하고, 다양한 대형 언어 모델 (LLM) 의 성능을 평가하여 전문가 수준의 빠른 영양 분석 가능성과 당뇨병 환자의 혈당 예측에 대한 실용적 위험을 입증했습니다.
이 논문은 대규모 언어 모델 (LLM) 추론 과정의 에너지 소비를 모니터링하고 최적화하기 위한 'MELODI' 프레임워크와 이를 통해 생성된 데이터셋을 소개하며, 프롬프트 속성과 에너지 효율 간의 상관관계를 분석하여 지속 가능한 LLM 배포를 위한 기초를 마련했습니다.
이 논문은 대규모 언어 모델의 미세 조정 시 발생하는 편향과 노이즈의 과도한 전파인 '재앙적 유전'을 완화하기 위해 일관성, 다양성, SVD 정규화를 결합한 새로운 효율적 파라미터 미세 조정 방법인 BA-LoRA 를 제안하고, 다양한 작업과 모델에서 기존 LoRA 변형들보다 뛰어난 성능과 편향 완화 효과를 입증합니다.
이 논문은 온톨로지 버전 관리 (OV) 를 위해 기존 온톨로지 매칭 (OM) 시스템을 재사용할 때 발생할 수 있는 한계를 분석하고, 교차 참조 (CR) 메커니즘을 도입하여 매칭 후보를 줄이고 버전 관리 성능을 향상시키는 'OM4OV' 파이프라인을 제안합니다.
이 논문은 인간 어노테이터 간의 불일치가 단순한 노이즈가 아니라 작업의 미명시나 응답 스타일 등 다양한 요인에 기인함을 규명하고, 이를 고려하지 않은 기존 보상 모델링 및 평가 방법의 한계를 지적하며, 이러한 이질적인 선호도를 식별하고 완화하는 새로운 방법론을 제시합니다.
이 논문은 HTML 의 계층적 구조와 UI 디자인 간의 간극을 해결하기 위해 구조 인식 어텐션 메커니즘과 대비 학습을 결합한 'Waffle'이라는 미세 조정 전략을 제안하여, 기존 방법보다 WebSight-Test 와 Design2Code 벤치마크에서 성능을 크게 향상시킨 다중 모달 모델을 소개합니다.
이 논문은 ChatGPT 를 활용하여 협업 문제 해결 (CPS) 의 의사소통 데이터를 자동 코딩할 수 있음을 입증하면서도, 모델 성능과 프롬프트 개선의 효과가 작업 및 코딩 프레임워크에 따라 달라질 수 있음을 보여줍니다.
별 Whisper 망원경은 대규모 망원경 배열의 운영 병목 현상을 해결하기 위해 대규모 언어 모델과 모듈형 워크플로우를 통합하여 천문 관측의 계획부터 데이터 처리 및 실시간 의사결정까지 전 과정을 자동화하는 AI 에이전트 프레임워크입니다.
본 논문은 검색 증강 생성 (RAG) 시스템의 성능 향상을 위해 의도 인식부터 응답 생성까지의 전 과정을 체계화한 '쿼리 최적화 수명주기 프레임워크'와 쿼리 복잡도 분류 체계를 제안하며, 주요 쿼리 최적화 기법들을 종합적으로 분석하고 향후 연구 방향을 제시합니다.
이 논문은 설명 가능한 기계 학습을 활용하여 언어적 특징을 분석함으로써 알츠하이머 및 관련 치매를 자동 선별하고 중증도를 예측하며, 가정용 대화 기술과의 통합을 통해 인지 건강 모니터링 및 고위험군 선별에 기여할 수 있음을 입증했습니다.
이 논문은 n-gram 모델과 Transformer 에서 홀루시네이션, 모노팩트 (monofact) 비율, 모델 보정 불일치 간의 관계를 실증적으로 규명하고, 소수의 학습 데이터를 전략적으로 재가중치하는 '선택적 상향 가중치 (selective upweighting)' 기법을 통해 정확도를 유지하면서 홀루시네이션을 최대 40% 까지 감소시킬 수 있음을 보여줍니다.