cs.CL 편의 논문 | Gist.Science

Open Rubric System: Scaling Reinforcement Learning with Pairwise Adaptive Rubric

이 논문은 다차원 인간 선호도를 단일 점수로 축소하는 기존 보상 모델의 한계를 극복하고, 오픈 엔디드 정렬을 위한 견고한 원칙 일반화를 실현하기 위해, 적응형 메타-루브릭과 검증 가능한 루브릭을 결합하여 명시적 추론 과정과 외부 기준별 비교를 통해 강화학습을 확장하는 '오픈 루브릭 시스템 (OpenRS)'을 제안합니다.

Ruipeng Jia, Yunyi Yang, Yuxin Wu + 6 more2026-03-02💬 cs.CL

Modeling Distinct Human Interaction in Web Agents

이 논문은 4,200 개 이상의 인간 및 에이전트 상호작용이 포함된 'CowCorpus' 데이터셋을 구축하고 인간 개입 패턴을 분석하여 에이전트가 개입 시점을 예측하도록 학습시킴으로써, 웹 에이전트의 사용성 및 적응성을 크게 향상시켰습니다.

Faria Huq, Zora Zhiruo Wang, Zhanqiu Guo + 6 more2026-03-02💬 cs.CL

Janus-Q: End-to-End Event-Driven Trading via Hierarchical-Gated Reward Modeling

이 논문은 뉴스 이벤트의 의미와 시장 반응을 통합한 대규모 데이터셋 구축과 다중 트레이딩 목표 간 균형을 잡는 계층적 게이트 보상 모델을 활용한 강화학습을 통해, 기존 시장 지수 및 LLM 기반 전략보다 우수한 수익률과 예측 정확도를 달성하는 종단간 이벤트 기반 트레이딩 프레임워크 'Janus-Q'를 제안합니다.

Xiang Li, Zikai Wei, Yiyan Qi + 6 more2026-03-02💬 cs.CL

Forecasting Future Language: Context Design for Mention Markets

이 논문은 이자 발표회 언급 시장 예측을 위해 뉴스와 이전 대본 등 풍부한 문맥 정보를 제공하고 시장 확률을 사전 확률로 활용하는 '시장 조건부 프롬프팅 (MCP)' 및 '혼합 모델 (MixMCP)'을 제안함으로써, 기존 시장 예측이나 단독 LLM 예측보다 더 정확하고 잘 교정된 미래 언어 예측을 가능하게 함을 보여줍니다.

Sumin Kim, Jihoon Kwon, Yoon Kim + 9 more2026-03-02💰 q-fin

Bridging Latent Reasoning and Target-Language Generation via Retrieval-Transition Heads

이 논문은 다국어 LLM 에서 추론과 타겟 언어 생성에 결정적인 역할을 하는 '검색-전이 헤드 (RTH)'를 발견하고, 기존 검색 헤드보다 RTH 를 마스킹할 때 성능 저하가 더 크다는 실험 결과를 통해 다국어 모델의 메커니즘을 규명했습니다.

Shaswat Patel, Vishvesh Trivedi, Yue Han + 2 more2026-03-02💬 cs.CL

Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization

이 논문은 추론 깊이를 확장하는 대신 증거 수집을 병렬화하고 통합 데이터 합성 파이프라인을 도입하여 효율성과 일반화 능력을 동시에 개선한 'Search More, Think Less(SMTL)' 프레임워크를 제안하며, 이를 통해 다양한 벤치마크에서 최첨단 성능을 달성하고 추론 단계를 대폭 줄였음을 보여줍니다.

Qianben Chen, Tianrui Qin, King Zhu + 21 more2026-03-02💬 cs.CL

MoDora: Tree-Based Semi-Structured Document Analysis System

MoDora 는 OCR 로 추출된 파편화된 요소를 레이아웃 인식 구성 요소로 통합하고, 계층적 구조와 레이아웃 차이를 명시적으로 모델링하는 '구성 요소 상관관계 트리 (CCTree)'를 구축하며, 질문 유형에 따라 최적화된 검색 전략을 적용함으로써 복잡한 반정형 문서에 대한 자연어 질문 응답 성능을 획기적으로 향상시키는 LLM 기반 분석 시스템입니다.

Bangrui Xu, Qihang Yao, Zirui Tang + 8 more2026-03-02💬 cs.CL

Why Diffusion Language Models Struggle with Truly Parallel (Non-Autoregressive) Decoding?

이 논문은 확산 언어 모델 (DLM) 이 훈련 데이터의 순차적 구조와 목표 함수 간의 불일치로 인해 비자율적 병렬 디코딩이 어렵다는 점을 지적하고, 독립적인 추론 경로를 구성하고 병렬 강제 디코딩을 적용한 NAP(Data-centric) 접근법을 통해 진정한 병렬 생성을 가능하게 하여 수학 추론 성능을 향상시켰음을 보여줍니다.

Pengxiang Li, Dilxat Muhtar, Tianlong Chen + 2 more2026-03-02💬 cs.CL

Serendipity with Generative AI: Repurposing knowledge components during polycrisis with a Viable Systems Model approach

이 논문은 생성형 AI 를 '우연성 엔진'으로 활용하여 기존 문서에서 지식 구성 요소를 추출하고 비어의 VSM(생존 시스템 모델) 에 맞춰 재배치함으로써 조직이 다중 위기 상황에서 지식 재사용을 체계화하고 혁신 포트폴리오를 전환할 수 있음을 보여줍니다.

Gordon Fletcher, Saomai Vu Khan2026-03-02💬 cs.CL

Reason to Contrast: A Cascaded Multimodal Retrieval Framework

이 논문은 추론 기반 토큰 확장 및 재순위화를 통해 기존 임베딩 크기 의존성을 극복하고 MMEB-V2 벤치마크에서 새로운 최고 성능을 달성한 계단식 멀티모달 검색 프레임워크 'TTE-v2'를 제안합니다.

Xuanming Cui, Hong-You Chen, Hao Yu + 10 more2026-03-02💬 cs.CL

Toward General Semantic Chunking: A Discriminative Framework for Ultra-Long Documents

이 논문은 고정된 윈도우의 한계를 극복하고 초장문 문서의 단락 경계 탐지 및 검색 효율성을 동시에 향상시키기 위해, 교차 윈도우 컨텍스트 융합 레이어와 스칼라 보정을 통한 벡터 융합 기법을 적용한 판별식 세그멘테이션 프레임워크를 제안합니다.

Kaifeng Wu, Junyan Wu, Qiang Liu + 2 more2026-03-02💬 cs.CL

Domain-Partitioned Hybrid RAG for Legal Reasoning: Toward Modular and Explainable Legal AI for India

이 논문은 인도 법률 연구의 복잡성을 해결하기 위해 도메인별 하이브리드 RAG 와 지식 그래프를 결합한 모듈식·설명 가능한 AI 아키텍처를 제안하며, 기존 RAG 대비 정확도와 추론 능력을 크게 향상시킨 결과를 보여줍니다.

Rakshita Goel, S Pranav Kumar, Anmol Agrawal + 3 more2026-03-02💬 cs.CL

Democratizing GraphRAG: Linear, CPU-Only Graph Retrieval for Multi-Hop QA

이 논문은 LLM 기반 그래프 구축과 GPU 추론 없이 NER 기반 공출현 그래프와 개인화 페이지랭크 (PPR) 를 활용하여 다중 홉 질의응답 성능을 유지하면서 토큰 비용과 GPU 요구 사항을 제거한 CPU 전용 선형 시간 GraphRAG 파이프라인인 SPRIG 을 제안합니다.

Qizhi Wang2026-03-02💬 cs.CL

An Agentic LLM Framework for Adverse Media Screening in AML Compliance

이 논문은 기존 키워드 기반 검색의 한계를 극복하고 거짓 양성률을 줄이기 위해, 검색·문서 처리·점수 산출을 자동화하는 다단계 LLM 에이전트 프레임워크를 통해 AML 규정 준수 내 부정적 미디어 선별을 혁신하는 방안을 제시합니다.

Pavel Chernakov, Sasan Jafarnejad, Raphaël Frank2026-03-02💬 cs.CL

Higress-RAG: A Holistic Optimization Framework for Enterprise Retrieval-Augmented Generation via Dual Hybrid Retrieval, Adaptive Routing, and CRAG

이 논문은 엔터프라이즈 RAG 시스템의 검색 정밀도, 환각 현상, 지연 시간 문제를 해결하기 위해 모델 컨텍스트 프로토콜 (MCP) 기반의 적응형 라우팅, 하이브리드 검색, CRAG 등을 통합한 'Higress-RAG'라는 포괄적인 최적화 프레임워크를 제안하고 그 유효성을 입증합니다.

Weixi Lin2026-03-02💬 cs.CL

← 이전 다음 →

cs.CL