An Agentic LLM Framework for Adverse Media Screening in AML Compliance
이 논문은 기존 키워드 기반 검색의 한계를 극복하고 거짓 양성률을 줄이기 위해, 검색·문서 처리·점수 산출을 자동화하는 다단계 LLM 에이전트 프레임워크를 통해 AML 규정 준수 내 부정적 미디어 선별을 혁신하는 방안을 제시합니다.
2646 편의 논문
이 논문은 기존 키워드 기반 검색의 한계를 극복하고 거짓 양성률을 줄이기 위해, 검색·문서 처리·점수 산출을 자동화하는 다단계 LLM 에이전트 프레임워크를 통해 AML 규정 준수 내 부정적 미디어 선별을 혁신하는 방안을 제시합니다.
이 논문은 엔터프라이즈 RAG 시스템의 검색 정밀도, 환각 현상, 지연 시간 문제를 해결하기 위해 모델 컨텍스트 프로토콜 (MCP) 기반의 적응형 라우팅, 하이브리드 검색, CRAG 등을 통합한 'Higress-RAG'라는 포괄적인 최적화 프레임워크를 제안하고 그 유효성을 입증합니다.
이 논문은 방대한 실제 대화 데이터와 모달리티 교차 학습 전략을 활용하여 기존 모델의 기계적인 한계를 극복하고, 자연스러운 억양과 감정적 공감을 구현하는 새로운 엔드투엔드 오디오 언어 모델인 'Hello-Chat'을 제안합니다.
이 논문은 26 개 언어에 걸친 50 개의 인도어 음성 데이터셋을 9 가지 다운스트림 작업에 대해 평가하고, 메타데이터 활용을 통한 교차 작업 유틸리티 분석을 통해 저자원 언어의 데이터 부족 문제를 해결하기 위한 'Task-Lens' 프레임워크를 제안합니다.
이 논문은 LLM 시대의 과학적 인용 신뢰성을 확보하기 위해, 환각된 인용을 탐지하고 검증하는 최초의 포괄적인 벤치마크와 다중 에이전트 기반의 검증 프레임워크를 제안합니다.
이 논문은 환자별 임상 질문에 대한 안전하고 효율적인 답변을 위해 자연어 질문을 FHIRPath 쿼리로 변환하는 새로운 패러다임을 제안하고, 이를 검증하기 위해 MIMIC-IV 데이터를 기반으로 한 대규모 오픈 데이터셋과 벤치마크인 FHIRPath-QA 를 소개합니다.
본 논문은 다중 문서 처리, 복잡한 추론, 엄격한 규정 준수를 위한 엔드투엔드 지능형 문서 처리 (IDP) 가속기 프레임워크를 제안하며, 이를 통해 의료 분야 등에서 기존 방식 대비 처리 지연 시간을 80% 단축하고 운영 비용을 77% 절감하는 성과를 입증했습니다.
이 논문은 인간이 제한된 정보를 바탕으로 확률적 추론을 수행하는 반면, 최신 추론 LLM 은 인간의 확률적 판단 분포를 재현하지 못하고 일관된 추론 패턴을 보이며 인간과 근본적으로 다른 양상을 나타낸다는 것을 'ProbCOPA' 데이터셋을 통해 규명했습니다.
이 논문은 '프랑스 또는 스페인, 혹은 독일 또는 프랑스'와 같은 겉보기에 중복된 선택적 문장이 맥락에 따라 수용 가능해지는 현상을 기존 기호론적 분석을 보완하는 신경망 기반 설명으로 규명하며, 인간과 대규모 언어 모델의 실험적 증거를 바탕으로 문맥 관련 정보를 반복된 어휘에 결합하고 트랜스포머 유도 헤드가 이를 선택적으로 주시하는 두 가지 메커니즘이 중복 회피를 가능하게 한다고 주장합니다.
이 논문은 온라인 대화에서 자살 사고를 탐지하기 위해 인지 평가 이론을 기반으로 한 반사실적 사용자 반응을 생성하는 추론 에이전트와 프론트 도어 조정 전략을 통해 숨겨진 편향을 완화하는 편향 인식 의사결정 에이전트를 협력적으로 활용하는 다중 에이전트 인과 추론 (MACR) 프레임워크를 제안합니다.
이 논문은 영어 학습자 (ELL) 의 자동 채점에서 발생하는 편향 증폭 문제를 해결하기 위해, 풍부한 비-ELL 고득점 샘플의 내용과 ELL 의 언어적 패턴을 결합한 가짜 데이터를 생성하는 'BRIDGE' 프레임워크를 제안하고, 이를 통해 California 과학 시험 (CAST) 데이터에서 편향을 효과적으로 완화하면서도 전체 채점 성능을 유지함을 입증합니다.
이 논문은 장문 질문 답변 (LFQA) 평가를 위해 130 만 개의 인간 선호도 데이터와 9 가지 평가 기준을 제안하고, 이를 기반으로 한 간단한 선형 모델이 최첨단 LLM 평가자와 유사한 성능을 보이며 LLM 평가자의 다양한 편향을 드러낸다는 점을 소개합니다.
이 논문은 기존 벤치마크의 한계를 극복하고 실제적인 논리적 추론 능력을 평가하기 위해, 삼단계 최적화를 활용하여 현실적인 다턴 태스크 지향 대화와 추론 작업을 생성하는 LLM 기반 프레임워크를 제안합니다.
이 논문은 기존 방법론의 한계를 극복하고 특허 기반 모순 마이닝의 정확도를 향상시키기 위해 TRIZ 지식 베이스 검색을 통합한 새로운 대규모 언어 모델 프레임워크인 TRIZ-RAGNER 을 제안하고, PaTRIZ 데이터셋 실험을 통해 기존 모델 대비 우수한 성능을 입증합니다.
이 논문은 MLLM 의 계층적 특성을 반영하여 시각 토큰을 90% 까지 압축하면서도 성능을 유지하고 학습 속도를 1.72 배 가속화하는 새로운 효율성 프레임워크 'HiDrop'을 제안합니다.
이 논문은 정적 데이터셋의 한계를 극복하고 LLM 의 진화하는 추론 능력을 평가하기 위해, 자율 에이전트들이 문제를 생성·검증·해결하는 동적 프로토콜을 도입하여 텍스트 이상 탐지 형식을 통해 기존 벤치마크가 놓친 추론 오류를 체계적으로 포착하는 새로운 평가 패러다임을 제안합니다.
이 논문은 시각적 객체 추적의 계산 비용을 줄이면서도 정확도를 유지하기 위해 검색 영역, 동적 템플릿, 정적 템플릿을 통합적으로 압축하는 새로운 단일 토큰 가지치기 프레임워크인 UTPTrack 을 제안하고, 다양한 벤치마크에서 기존 방법보다 뛰어난 성능과 효율성을 입증합니다.
이 논문은 소량 데이터 환경에서의 텍스트 분류 성능을 향상시키기 위해, 다차원 의미 요인으로 구성된 구조화된 프롬프트와 잠재 공간 내 의미 정렬 메커니즘을 도입하여 의미적 혼란을 해소하고 라벨 불명확성을 개선하는 최적화 프레임워크를 제안합니다.
이 논문은 확산 기반 대규모 언어 모델 (dLLM) 의 이론적 병렬성과 실제 성능 간의 격차를 해소하기 위해, 분할 (Divide) 과 정복 (Conquer) 단계를 반복하고 마지막에 정제 단계를 거치는 적응형 병렬 디코딩 기법인 'DiCo'를 제안하여 추론 속도를 크게 향상시키면서도 생성 품질을 유지하는 방법을 제시합니다.
이 논문은 SwiGLU 와 같은 게이트 활성화 함수를 사용하는 최신 트랜스포머 언어 모델의 해석 가능성을 높이기 위해, 각 뉴런의 게이트와 입력 활성화의 네 가지 부호 조합에 따른 텍스트 예시와 발생 빈도를 분석하는 오픈소스 도구인 GLUScope 를 제안합니다.