Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering

이 논문은 대규모 멀티모달 모델의 소수 샷 시각적 질문 응답 (VQA) 성능을 향상시키기 위해, 태스크 관련 시각적 특징에서 추출된 소프트 프롬프트를 메타 학습 방식으로 증류하고 테스트 시 적응하는 '메타 적응형 프롬프트 증류' 방법을 제안하며, 이를 통해 기존 인-컨텍스트 학습 및 파라미터 효율적 파인튜닝 기법보다 우수한 성능을 입증했습니다.

Akash Gupta, Amos Storkey, Mirella Lapata2026-03-03💬 cs.CL

Equitable Electronic Health Record Prediction with FAME: Fairness-Aware Multimodal Embedding

이 논문은 다양한 모달리티의 공헌도를 기반으로 가중치를 부여하고 오류 분포 불균형 지수 (EDDI) 를 활용하여 성능과 공정성을 동시에 최적화하는 공정한 전자건강기록 예측 프레임워크인 FAME 을 제안하고, 이를 통해 다양한 예측 작업에서 기존 모델 대비 향상된 공정성과 성능을 입증합니다.

Nikkie Hooman, Zhongjie Wu, Eric C. Larson + 1 more2026-03-03💬 cs.CL

Language Agents for Hypothesis-driven Clinical Decision Making with Reinforcement Learning

이 논문은 진단을 위해 반복적으로 검사를 요청하고 해석하는 가설 기반 불확실성 인식 언어 에이전트 (LA-CDM) 를 제안하며, 지도 학습과 강화 학습을 결합한 하이브리드 훈련 방식을 통해 임상 의사결정의 정확성과 효율성을 향상시켰음을 보여줍니다.

David Bani-Harouni, Chantal Pellegrini, Ege Özsoy + 2 more2026-03-03💬 cs.CL

AgentSynth: Scalable Task Generation for Generalist Computer-Use Agents

이 논문은 정보 비대칭을 활용하여 일반 컴퓨터 사용 에이전트를 위한 고품질 태스크와 궤적 데이터를 자동 생성하는 확장성 있고 비용 효율적인 파이프라인인 AgentSynth 를 제안하며, 이를 통해 6,000 개 이상의 다양한 태스크를 생성하고 기존 LLM 에이전트의 성능 한계를 입증했습니다.

Jingxu Xie, Dylan Xu, Xuandong Zhao + 1 more2026-03-03💬 cs.CL

GenRecal: Generation after Recalibration from Large to Small Vision-Language Models

이 논문은 이질적인 비전 - 언어 모델 간의 아키텍처 및 토큰 차이로 인한 지식 증류의 한계를 극복하기 위해 '재보정 (Recalibrator)'을 도입하여 대규모 모델의 성능을 소형 모델로 효과적으로 이전하는 범용 증류 프레임워크인 'GenRecal'을 제안하고, 이를 통해 기존 오픈소스 및 폐쇄형 대규모 모델들을 능가하는 성능을 입증했습니다.

Byung-Kwan Lee, Ryo Hachiuma, Yong Man Ro + 2 more2026-03-03💬 cs.CL

FrugalRAG: Less is More in RL Finetuning for Multi-Hop Question Answering

이 논문은 다단계 질문 답변 작업에서 최종 답변의 정확성과 효율성을 동시에 최적화하기 위해, 질문의 난이도에 따라 검색 단계를 적응적으로 줄이는 두 단계 미세 조정 프레임워크인 FrugalRAG 를 제안하며, 소량의 데이터로도 기존 방법 대비 검색 비용을 절반으로 줄이면서 최첨단 성능을 달성함을 보여줍니다.

Abhinav Java, Srivathsan Koundinyan, Nagarajan Natarajan + 1 more2026-03-03💬 cs.CL

SpiroLLM: Finetuning Pretrained LLMs to Understand Spirogram Time Series with Clinical Validation in COPD Reporting

이 논문은 UK Biobank 의 대규모 코호트를 기반으로 폐활량 측정 그래프를 이해하고 COPD 진단에 대한 해석 가능한 보고서를 생성할 수 있는 최초의 멀티모달 대형 언어 모델인 SpiroLLM 을 제안하여, 기존 AI 모델의 설명 부족 문제를 해결하고 임상적 신뢰성을 입증했습니다.

Shuhao Mei, Yongchao Long, Xiaoyu Xiao + 6 more2026-03-03💬 cs.CL