Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms
이 논문은 교육용 RAG 시스템의 사실적 정확도를 높이기 위해 엔티티 링크링을 통합한 ELERAG 아키텍처를 제안하고, 도메인 특화 데이터셋에서 기존 베이스라인 및 크로스-인코더 기반 방법보다 우수한 성능을 입증했습니다.
2385 편의 논문
이 논문은 교육용 RAG 시스템의 사실적 정확도를 높이기 위해 엔티티 링크링을 통합한 ELERAG 아키텍처를 제안하고, 도메인 특화 데이터셋에서 기존 베이스라인 및 크로스-인코더 기반 방법보다 우수한 성능을 입증했습니다.
이 논문은 무선 네트워크의 주파수 선택적 전자기장 (EMF) 예측을 위해 다양한 맥락 정보를 통합하고 불확실성을 정량화하는 조건부 확산 기반 프레임워크 'EMFusion'을 제안하며, 기존 모델보다 예측 정확도와 신뢰성을 크게 향상시킨다고 설명합니다.
이 논문은 Hugging Face TRL 을 활용한 단일 에포크 감독 미세조정 (SFT) 으로 3.5 억 파라미터 규모의 소형 언어 모델 (SLM) 을 학습시켜 ToolBench 평가에서 77.55% 의 높은 통과율을 기록하며, ChatGPT-CoT 등 대형 모델들을 압도하는 효율적인 에이전트 도구 호출 솔루션을 제시합니다.
이 논문은 LLM 에이전트의 지속적인 자기 개선과 적응 능력을 향상시키기 위해, 이전 작업에서 생성된 기술이 축적되어 후속 작업에 활용되도록 하는 '시퀀셜 롤아웃'과 기술 통합 보상 메커니즘을 도입한 강화 학습 프레임워크인 SAGE 를 제안하고, AppWorld 환경에서 기존 방법보다 정확도와 효율성을 크게 개선한 결과를 입증합니다.
이 논문은 고차원 공간에서의 유클리드 - 측지선 불일치 문제를 해결하기 위해 국소 내재 차원성 (LID) 을 활용하여 데이터 매니폴드의 기하학적 특성에 동적으로 적응하는 디스크 기반 벡터 검색 인덱싱 방법인 MCGI 를 제안하며, 수십억 규모 데이터셋에서 기존 최첨단 기법 대비 뛰어난 처리량과 낮은 지연 시간을 입증합니다.
이 논문은 기존 활성화 기반 방법의 한계를 극복하고, 표적 뉴런 개입을 통해 언어별 예측에 대한 기능적 기여도를 분석하여 다국어 대형 언어 모델 내 언어별 뉴런의 비대칭적 전문성을 규명하는 CRANE 프레임워크를 제안합니다.
이 논문은 학습된 단일 모델로 재학습 없이도 임의의 조건부 추론을 수행하고 불확실성을 정량화할 수 있도록, 확률적 반복 베이지안 업데이트 알고리즘을 기반으로 한 새로운 베이지안 생성 모델링 (BGM) 프레임워크를 제안합니다.
이 논문은 위성 메가컨스텔레이션 시대에 우주선 전원 시스템의 건강 관리를 혁신하기 위해 인간-AI 협업 프레임워크인 SpaceHMchat 과 새로운 데이터셋을 제안하고, 하드웨어 기반 실험을 통해 그 탁월한 성능을 입증했습니다.
이 논문은 단일 모드, 미세 병변 패턴, 장비 간 편차로 인한 한계를 극복하기 위해 하이퍼네트워크 기반 적응적 조건부 레이어 (HaC) 와 증거 불확실성 학습 기반 신뢰성 예측 체계 (RaP) 를 도입한 CLEAR-Mamba 프레임워크를 제안하여, FFA 및 ICGA 영상을 포함한 대규모 안과 혈관조영 데이터셋에서 기존 모델보다 뛰어난 분류 성능과 신뢰성을 입증했습니다.
이 논문은 대규모 언어 모델 (LLM) 기반 웹 연구 에이전트를 활용하여 자동화되고 검증 가능한 다양한 미래 예측 질문 생성 및 해결 시스템을 구축하고, 이를 통해 AI 예측 모델의 성능 평가와 예측 정확도 향상을 입증했습니다.
이 논문은 고품질의 다턴 도구 사용 데이터를 생성하고 검증 기반 강화 학습을 통해 사용자 시뮬레이션 노이즈를 줄이는 통합 프레임워크인 'EigenData'를 제안하여, 고비용 인간 라벨링 없이도 복잡한 도구 사용 에이전트를 확장 가능하게 학습시키는 방법을 제시합니다.
이 논문은 Swin U-Net 기반의 게이트형 멀티헤드 Transformer 아키텍처를 제안하여 병렬 검출 헤드를 통해 슬라이스별 구조 존재 여부를 판단하고 이를 세그멘테이션 예측에 적용함으로써, 방사선 치료 자동 분할에서 해부학적으로 불가능한 가짜 양성 (hallucinations) 을 효과적으로 제거하고 모델의 견고성과 임상적 신뢰성을 크게 향상시켰음을 보여줍니다.
이 논문은 사전 학습된 트랜스포머 모델의 가중치를 수정하지 않고 추론 시 몬테카를로 드롭아웃을 통해 자기주의 메커니즘에 불확실성을 주입하여 예측 신뢰도를 개선하고 선택적 예측을 가능하게 하는 'UAT-LITE'라는 프레임워크를 제안합니다.
이 논문은 웹 콘텐츠 접근성 가이드라인 (WCAG2) 위반 사항을 자동으로 수정하면서도 원본 디자인을 유지하는 비전 - 언어 모델 'WebAccessVL'을 제안하고, 위반 조건을 입력으로 활용하는 반복적 개선 전략을 통해 기존 모델 대비 접근성 오류를 87% 이상 감소시킨 효과를 입증했습니다.
이 논문은 챗봇에 대한 사용자의 신뢰가 실제 신뢰성보다는 인지적 편향을 활용한 설계에서 비롯된다는 점을 지적하며, 챗봇을 '동반자'가 아닌 조직의 목표를 추구하는 '고도화된 영업사원'으로 재정의하고 심리적 신뢰 형성 과정과 규범적 신뢰성 사이의 혼란을 해소할 필요성을 주장합니다.
이 논문은 단일 RGB 이미지에서 기하학적 정합성을 개선하기 위해 정상 추정 문제를 그림자 시퀀스 추정으로 재정의하고, 이미지-비디오 생성 모델을 활용하여 RoSE 라는 새로운 방법을 제안합니다.
이 논문은 영향 함수를 활용하여 훈련 데이터에 미세한 교란을 가해 모델의 행동을 의도적으로 조작하는 'Infusion' 프레임워크를 제안하고, 이를 통해 소량의 훈련 데이터만으로도 다양한 아키텍처에 걸쳐 모델 행동을 효과적으로 변화시킬 수 있음을 입증합니다.
이 논문은 기존 방법론이 간과했던 정확도와 에너지 효율성의 동시 최적화를 위해 경험 재생, 가변적 누적 - 적분 - 방출 뉴런 매개변수, 적응형 스파이크 스케줄러를 통합한 에너지 인식 스파이크 예산 관리 프레임워크를 제안하여, 프레임 기반 및 이벤트 기반 데이터셋 모두에서 지속적 학습 성능을 향상시키고 동적 전력 소비를 최소화하는 뉴로모픽 비전 시스템의 실용성을 입증합니다.
이 논문은 확산 모델의 고해상도 추론 지연과 희소 감독의 한계를 해결하기 위해, 교사의 궤적 중간 단계를 모두 학습하는 밀집 앙상블 네트워크 (B-DENSE) 를 제안하여 이미지 생성 품질을 향상시킵니다.
이 논문은 단일 상태 온톨로지 모델이 정보 이론적 관점에서 맥락성 비용을 피할 수 없음을 증명하고, 양자 역학이 이 제약을 우회하는 방식을 설명함으로써 맥락성이 고전적 표현의 근본적인 한계임을 규명합니다.