cs.CL 편의 논문 | Gist.Science

An Agentic LLM Framework for Adverse Media Screening in AML Compliance

이 논문은 기존 키워드 기반 검색의 한계를 극복하고 거짓 양성률을 줄이기 위해, 검색·문서 처리·점수 산출을 자동화하는 다단계 LLM 에이전트 프레임워크를 통해 AML 규정 준수 내 부정적 미디어 선별을 혁신하는 방안을 제시합니다.

Pavel Chernakov, Sasan Jafarnejad, Raphaël Frank2026-03-02💬 cs.CL

Higress-RAG: A Holistic Optimization Framework for Enterprise Retrieval-Augmented Generation via Dual Hybrid Retrieval, Adaptive Routing, and CRAG

이 논문은 엔터프라이즈 RAG 시스템의 검색 정밀도, 환각 현상, 지연 시간 문제를 해결하기 위해 모델 컨텍스트 프로토콜 (MCP) 기반의 적응형 라우팅, 하이브리드 검색, CRAG 등을 통합한 'Higress-RAG'라는 포괄적인 최적화 프레임워크를 제안하고 그 유효성을 입증합니다.

Weixi Lin2026-03-02💬 cs.CL

Hello-Chat: Towards Realistic Social Audio Interactions

이 논문은 방대한 실제 대화 데이터와 모달리티 교차 학습 전략을 활용하여 기존 모델의 기계적인 한계를 극복하고, 자연스러운 억양과 감정적 공감을 구현하는 새로운 엔드투엔드 오디오 언어 모델인 'Hello-Chat'을 제안합니다.

Yueran Hou, Peilei Jia, Zihan Sun + 5 more2026-03-02⚡ eess

Task-Lens: Cross-Task Utility Based Speech Dataset Profiling for Low-Resource Indian Languages

이 논문은 26 개 언어에 걸친 50 개의 인도어 음성 데이터셋을 9 가지 다운스트림 작업에 대해 평가하고, 메타데이터 활용을 통한 교차 작업 유틸리티 분석을 통해 저자원 언어의 데이터 부족 문제를 해결하기 위한 'Task-Lens' 프레임워크를 제안합니다.

Swati Sharma, Divya V. Sharma, Anubha Gupta2026-03-02⚡ eess

CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

이 논문은 LLM 시대의 과학적 인용 신뢰성을 확보하기 위해, 환각된 인용을 탐지하고 검증하는 최초의 포괄적인 벤치마크와 다중 에이전트 기반의 검증 프레임워크를 제안합니다.

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang + 3 more2026-03-02💬 cs.CL

FHIRPath-QA: Executable Question Answering over FHIR Electronic Health Records

이 논문은 환자별 임상 질문에 대한 안전하고 효율적인 답변을 위해 자연어 질문을 FHIRPath 쿼리로 변환하는 새로운 패러다임을 제안하고, 이를 검증하기 위해 MIMIC-IV 데이터를 기반으로 한 대규모 오픈 데이터셋과 벤치마크인 FHIRPath-QA 를 소개합니다.

Michael Frew, Nishit Bheda, Bryan Tripp2026-03-02💬 cs.CL

IDP Accelerator: Agentic Document Intelligence from Extraction to Compliance Validation

본 논문은 다중 문서 처리, 복잡한 추론, 엄격한 규정 준수를 위한 엔드투엔드 지능형 문서 처리 (IDP) 가속기 프레임워크를 제안하며, 이를 통해 의료 분야 등에서 기존 방식 대비 처리 지연 시간을 80% 단축하고 운영 비용을 77% 절감하는 성과를 입증했습니다.

Md Mofijul Islam, Md Sirajus Salekin, Joe King + 7 more2026-03-02💬 cs.CL

Humans and LLMs Diverge on Probabilistic Inferences

이 논문은 인간이 제한된 정보를 바탕으로 확률적 추론을 수행하는 반면, 최신 추론 LLM 은 인간의 확률적 판단 분포를 재현하지 못하고 일관된 추론 패턴을 보이며 인간과 근본적으로 다른 양상을 나타낸다는 것을 'ProbCOPA' 데이터셋을 통해 규명했습니다.

Gaurav Kamath, Sreenath Madathil, Sebastian Schuster + 2 more2026-03-02💬 cs.CL

France or Spain or Germany or France: A Neural Account of Non-Redundant Redundant Disjunctions

이 논문은 '프랑스 또는 스페인, 혹은 독일 또는 프랑스'와 같은 겉보기에 중복된 선택적 문장이 맥락에 따라 수용 가능해지는 현상을 기존 기호론적 분석을 보완하는 신경망 기반 설명으로 규명하며, 인간과 대규모 언어 모델의 실험적 증거를 바탕으로 문맥 관련 정보를 반복된 어휘에 결합하고 트랜스포머 유도 헤드가 이를 선택적으로 주시하는 두 가지 메커니즘이 중복 회피를 가능하게 한다고 주장합니다.

Sasha Boguraev, Qing Yao, Kyle Mahowald2026-03-02💬 cs.CL

Multi-Agent Causal Reasoning for Suicide Ideation Detection Through Online Conversations

이 논문은 온라인 대화에서 자살 사고를 탐지하기 위해 인지 평가 이론을 기반으로 한 반사실적 사용자 반응을 생성하는 추론 에이전트와 프론트 도어 조정 전략을 통해 숨겨진 편향을 완화하는 편향 인식 의사결정 에이전트를 협력적으로 활용하는 다중 에이전트 인과 추론 (MACR) 프레임워크를 제안합니다.

Jun Li, Xiangmeng Wang, Haoyang Li + 6 more2026-03-02💬 cs.CL

BRIDGE the Gap: Mitigating Bias Amplification in Automated Scoring of English Language Learners via Inter-group Data Augmentation

이 논문은 영어 학습자 (ELL) 의 자동 채점에서 발생하는 편향 증폭 문제를 해결하기 위해, 풍부한 비-ELL 고득점 샘플의 내용과 ELL 의 언어적 패턴을 결합한 가짜 데이터를 생성하는 'BRIDGE' 프레임워크를 제안하고, 이를 통해 California 과학 시험 (CAST) 데이터에서 편향을 효과적으로 완화하면서도 전체 채점 성능을 유지함을 입증합니다.

Yun Wang, Xuansheng Wu, Jingyuan Huang + 3 more2026-03-02💬 cs.CL

LFQA-HP-1M: A Large-Scale Human Preference Dataset for Long-Form Question Answering

이 논문은 장문 질문 답변 (LFQA) 평가를 위해 130 만 개의 인간 선호도 데이터와 9 가지 평가 기준을 제안하고, 이를 기반으로 한 간단한 선형 모델이 최첨단 LLM 평가자와 유사한 성능을 보이며 LLM 평가자의 다양한 편향을 드러낸다는 점을 소개합니다.

Rafid Ishrak Jahan, Fahmid Shahriar Iqbal, Sagnik Ray Choudhury2026-03-02💬 cs.CL

LLM-Driven Multi-Turn Task-Oriented Dialogue Synthesis for Realistic Reasoning

이 논문은 기존 벤치마크의 한계를 극복하고 실제적인 논리적 추론 능력을 평가하기 위해, 삼단계 최적화를 활용하여 현실적인 다턴 태스크 지향 대화와 추론 작업을 생성하는 LLM 기반 프레임워크를 제안합니다.

Yu Zhu, Kai Yang2026-03-02💬 cs.CL

TRIZ-RAGNER: A Retrieval-Augmented Large Language Model for TRIZ-Aware Named Entity Recognition in Patent-Based Contradiction Mining

이 논문은 기존 방법론의 한계를 극복하고 특허 기반 모순 마이닝의 정확도를 향상시키기 위해 TRIZ 지식 베이스 검색을 통합한 새로운 대규모 언어 모델 프레임워크인 TRIZ-RAGNER 을 제안하고, PaTRIZ 데이터셋 실험을 통해 기존 모델 대비 우수한 성능을 입증합니다.

Zitong Xu, Yuqing Wu, Yue Zhao2026-03-02💬 cs.CL

← 이전 다음 →

cs.CL