cs.AI 편의 논문 | Gist.Science

Information-Consistent Language Model Recommendations through Group Relative Policy Optimization

이 논문은 그룹 상대적 정책 최적화 (GRPO) 기반의 강화학습 프레임워크를 도입하여, 의미적으로 동일한 프롬프트에 대해 정보 일관성을 보장하고 기업 환경에서의 LLM 추천 신뢰성을 향상시키는 새로운 방법을 제시합니다.

Sonal Prabhune, Balaji Padmanabhan, Kaushik Dutta2026-03-16🤖 cs.AI

Epistemic diversity across language models mitigates knowledge collapse

이 논문은 다양한 언어 모델로 구성된 AI 생태계의 다양성이 단일 모델의 자기 학습 과정에서 발생하는 지식 붕괴를 완화하고 장기적인 성능을 향상시키는 핵심 요소임을 실험을 통해 입증했습니다.

Damian Hodel, Jevin D. West2026-03-16🤖 cs.AI

FCMBench: The First Large-scale Financial Credit Multimodal Benchmark for Real-world Applications

이 논문은 실제 금융 신용 업무의 프라이버시 준수 요구사항과 강건성 평가를 반영한 최초의 대규모 멀티모달 벤치마크인 'FCMBench'를 제안하고, 28 개의 최첨단 비전 - 언어 모델에 대한 평가 결과를 통해 해당 벤치마크가 현대 모델의 능력을 구분하는 데 유효함을 입증했습니다.

Yehui Yang, Dalu Yang, Fangxin Shang + 7 more2026-03-16🤖 cs.AI

Mitigating Latent Mismatch in cVAE-Based Singing Voice Synthesis via Flow Matching

이 논문은 cVAE 기반 가창 음성 합성에서 훈련과 추론 간의 잠재 공간 불일치를 완화하여 표현력을 향상시키기 위해, 추론 시 잠재 표현을 후사분포와 유사하게 정제하는 플로우 매칭 기반의 FM-Singer 프레임워크를 제안합니다.

Minhyeok Yun, Yong-Hoon Choi2026-03-16⚡ eess

DeCode: Decoupling Content and Delivery for Medical QA

이 논문은 기존 LLM 이 환자별 맥락을 고려하지 못하는 문제를 해결하기 위해 훈련 없이 적용 가능한 'DeCode' 프레임워크를 제안하고, 이를 통해 OpenAI HealthBench 에서 기존 방법 대비 새로운 최첨단 성능을 달성했다고 설명합니다.

Po-Jen Ko, Chen-Han Tsai, Yu-Shao Peng2026-03-16💬 cs.CL

AnatomiX, an Anatomy-Aware Grounded Multimodal Large Language Model for Chest X-Ray Interpretation

본 논문은 기존 모델이 겪는 공간 추론 및 해부학적 이해의 한계를 극복하기 위해, 해부학적 구조 식별과 특징 추출을 거쳐 다양한 하위 태스크를 수행하는 2 단계 접근법을 도입한 'AnatomiX'라는 해부학 인식 기반의 다중 모달 대규모 언어 모델을 제안하고, 이를 통해 해부학 기반 진단 및 설명 생성 등 여러 태스크에서 기존 방법 대비 25% 이상의 성능 향상을 입증했습니다.

Anees Ur Rehman Hashmi, Numan Saeed, Christoph Lippert2026-03-16🤖 cs.AI

Key-Value Pair-Free Continual Learner via Task-Specific Prompt-Prototype

이 논문은 키 - 값 쌍에 의존하지 않고 태스크별 프롬프트와 프로토타입을 결합하여 상호 간섭을 줄이고 확장성을 높이는 새로운 지속 학습 프레임워크인 ProP 를 제안합니다.

Haihua Luo, Xuming Ran, Zhengji Li + 6 more2026-03-16🤖 cs.AI

Auditing Student-AI Collaboration: A Case Study of Online Graduate CS Students

이 논문은 온라인 대학원생의 생성형 AI 활용 실태와 선호도를 혼합 방법론으로 분석하여, 현재 AI 기술의 기능과 학생들의 기대 수준 간의 격차를 규명하고 교육용 AI 시스템의 신뢰성 및 효과성 향상을 위한 방향을 제시합니다.

Nifu Dan2026-03-16🤖 cs.AI

Development of Ontological Knowledge Bases by Leveraging Large Language Models

이 논문은 대규모 언어 모델 (LLM) 을 활용한 구조화된 반복적 방법론을 제시하여 수동 개발의 한계를 극복하고, 자동차 판매 도메인 사례를 통해 온톨로지 지식 베이스의 구축 속도, 일관성 및 확장성을 획기적으로 개선하는 방안을 논의합니다.

Le Ngoc Luyen, Marie-Hélène Abel, Philippe Gouspillou2026-03-16🤖 cs.AI

OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and Generation

이 논문은 VAE 잠재 공간에서 이미지 재구성 및 의미 학습을 동시에 최적화하여 생성과 이해라는 두 가지 작업을 모두 효과적으로 수행하는 통합 비전 인코더 'OpenVision 3'를 제안하고, 이를 통해 생성 및 다중모달 이해 작업에서 기존 CLIP 기반 모델을 능가하거나 견줄 만한 성능을 입증합니다.

Letian Zhang, Sucheng Ren, Yanqing Liu, Xianhang Li, Zeyu Wang, Yuyin Zhou, Huaxiu Yao, Zeyu Zheng, Weili Nie, Guilin Liu, Zhiding Yu, Cihang Xie2026-03-16⚡ eess

MalURLBench: A Benchmark Evaluating Agents' Vulnerabilities When Processing Web URLs

이 논문은 LLM 기반 웹 에이전트가 악성 URL 처리 시 가지는 취약점을 평가하기 위해 10 가지 실세계 시나리오와 7 가지 악성 웹사이트 카테고리를 포함한 최초의 벤치마크인 'MalURLBench'를 제안하고, 기존 모델들의 취약성을 분석하며 경량 방어 모듈인 'URLGuard'를 소개합니다.

Dezhang Kong, Zhuxi Wu, Shiqi Liu + 8 more2026-03-16🤖 cs.AI

CCMamba: Topologically-Informed Selective State-Space Networks on Combinatorial Complexes for Higher-Order Graph Learning

이 논문은 기존 고차원 그래프 학습 방법의 확장성 및 장거리 의존성 모델링 한계를 극복하기 위해, 조합적 복합체 (Combinatorial Complexes) 상에서 선형 시간 복잡도로 작동하는 최초의 통합 Mamba 기반 신경망 프레임워크인 CCMamba 를 제안하고, 이를 통해 다양한 벤치마크에서 우수한 성능과 확장성을 입증했습니다.

Jiawen Chen, Qi Shao, Mingtong Zhou + 2 more2026-03-16🤖 cs.AI

← 이전 다음 →

cs.AI

Information-Consistent Language Model Recommendations through Group Relative Policy Optimization

Epistemic diversity across language models mitigates knowledge collapse

FCMBench: The First Large-scale Financial Credit Multimodal Benchmark for Real-world Applications

Mitigating Latent Mismatch in cVAE-Based Singing Voice Synthesis via Flow Matching

DeCode: Decoupling Content and Delivery for Medical QA

AnatomiX, an Anatomy-Aware Grounded Multimodal Large Language Model for Chest X-Ray Interpretation

Key-Value Pair-Free Continual Learner via Task-Specific Prompt-Prototype

Auditing Student-AI Collaboration: A Case Study of Online Graduate CS Students

Development of Ontological Knowledge Bases by Leveraging Large Language Models

OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and Generation

MalURLBench: A Benchmark Evaluating Agents' Vulnerabilities When Processing Web URLs

CCMamba: Topologically-Informed Selective State-Space Networks on Combinatorial Complexes for Higher-Order Graph Learning

MoHETS: Long-term Time Series Forecasting with Mixture-of-Heterogeneous-Experts

Learnable Koopman-Enhanced Transformer-Based Time Series Forecasting with Spectral Control

Do LLMs Share Human-Like Biases? Causal Reasoning Under Prior Knowledge, Irrelevant Context, and Varying Compute Budgets

Automatic In-Domain Exemplar Construction and LLM-Based Refinement of Multi-LLM Expansions for Query Expansion

RooflineBench: A Benchmarking Framework for On-Device LLMs via Roofline Analysis

Variation-aware Flexible 3D Gaussian Editing

Tiny Recursive Reasoning with Mamba-2 Attention Hybrid

Asynchronous Verified Semantic Caching for Tiered LLM Architectures