A Causal Graph Approach to Oppositional Narrative Analysis

이 논문은 인간 편향이 개입된 기존 블랙박스 모델을 대체하여, 담화 내 개체 간 상호작용을 그래프로 표현하고 노드 수준의 인과 추정을 통해 최소 인과 서브그래프를 추출함으로써 대립적 내러티브 분류 성능을 획기적으로 향상시키는 새로운 프레임워크를 제안합니다.

Diego Revilla, Martin Fernandez-de-Retana, Lingfeng Chen, Aritz Bilbao-Jayo, Miguel Fernandez-de-Retana2026-03-09🤖 cs.AI

Contrastive-to-Self-Supervised: A Two-Stage Framework for Script Similarity Learning

이 논문은 인공 알파벳의 레이블된 데이터를 기반으로 한 대비 학습으로 교사를 훈련한 후, 역사적 문자 체계에 대한 비지도 지식 증류를 적용하여 지도 학습과 비지도 발견을 연결하는 2 단계 프레임워크를 제안하여, 진화적 관계에 대한 정답이 없어도 글자 인식과 문자 군집화를 효과적으로 수행할 수 있음을 보여줍니다.

Claire Roman, Philippe Meyer2026-03-09🤖 cs.AI

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

이 논문은 숙련된 방사선과 전문의의 자문을 바탕으로 임상적 중요도와 환자 안전을 고려한 오류 분류 체계와 가중치 부여 방식을 도입하여, 기존 평가 지표보다 방사선과 전문의의 판단과 더 높은 일치도를 보이는 흉부 X-ray 보고서 생성 평가 프레임워크인 CRIMSON 을 제안하고 검증합니다.

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI

MAPO: Mixed Advantage Policy Optimization for Long-Horizon Multi-Turn Dialogue

MAPO 는 신뢰할 수 있는 과정 감독이 부재한 주관적 다턴 대화 과제를 위해, 판사 모델의 밀집 피드백과 Monte Carlo 반환을 활용하고 턴별 및 배치별 정규화를 혼합한 어드밴티지 추정기를 도입하여 장기적 상호작용 품질을 효율적으로 최적화하는 크리티크 없는 강화학습 알고리즘을 제안합니다.

Naifan Zhang, Ruihan Sun, Jinwei Su, Hengjie Yang, Zhengyuan Pan, Zhaohan Chen, Xiaofan Zhang2026-03-09🤖 cs.AI

Wisdom of the AI Crowd (AI-CROWD) for Ground Truth Approximation in Content Analysis: A Research Protocol & Validation Using Eleven Large Language Models

이 논문은 대규모 콘텐츠 분석에서 인간 코딩의 한계를 극복하기 위해 여러 대규모 언어 모델 (LLM) 의 집단적 출력을 합의 기반으로 통합하여 '진실'에 근사한 기준을 생성하는 'AI-CROWD' 프로토콜을 제안하고 검증합니다.

Luis de-Marcos, Manuel Goyanes, Adrián Domínguez-Díaz2026-03-09💬 cs.CL

SPOT: Span-level Pause-of-Thought for Efficient and Interpretable Latent Reasoning in Large Language Models

이 논문은 고정된 템플릿을 강요하지 않고 Sinkhorn 최적 수송 기반의 스펀 차원 의미 정렬과 프리즈드 헤드 디코딩 제약을 통해, 대규모 언어 모델의 추론 정확도를 높이고 토큰 생성량을 줄이면서도 해석 가능한 잠재 추론을 가능하게 하는 SPOT 프레임워크를 제안합니다.

Yunlong Chu, Minglai Shao, Yuhang Liu, Bing Hao, Yumeng Lin, Jialu Wang, Ruijie Wang2026-03-09💬 cs.CL

Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion

이 논문은 다국어·다문화 환경에서 배포되는 대형 언어 모델 (LLM) 이 영어 중심 데이터로 인해 아시아 지역의 종교적 소수자 의견과 문화적 가치에 부합하지 못하고 편향을 강화하는 문제를 다국어 감사와 내부 표현 분석을 통해 규명하고, 지역 기반의 체계적 감사가 필요함을 강조합니다.

Hari Shankar, Vedanta S P, Sriharini Margapuri, Debjani Mazumder, Ponnurangam Kumaraguru, Abhijnan Chakraborty2026-03-09💬 cs.CL

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

이 논문은 단편화된 개인 데이터를 통합하고 신뢰할 수 있는 추론을 가능하게 하기 위해 멀티모달 언어 모델, 개인 지식 그래프, 그리고 온라인 심층 시각 정제를 결합한 신경-상징적 아키텍처인 'EpisTwin'을 제안합니다.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

Continual Adaptation for Pacific Indigenous Speech Recognition

이 논문은 데이터 부족과 파급적 망각 문제를 겪는 태평양 원주민 언어를 위한 음성 모델 적응 전략을 실증적으로 연구하여, 저랭크 적응 (LoRA) 이 초기에는 효과적이지만 연속 학습 시 파급적 망각을 초래하며, 이러한 언어에 적합한 강건한 적응 전략의 필요성을 강조합니다.

Yang Xiao, Aso Mahmudi, Nick Thieberger, Eliathamby Ambikairajah, Eun-Jung Holden, Ting Dang2026-03-09💬 cs.CL

The Art That Poses Back: Assessing AI Pastiches after Contemporary Artworks

이 논문은 12 명의 현대 예술가들의 참여를 통해 ChatGPT 가 생성한 원작의 파스티시 (pastiche) 를 분석한 결과, AI 는 색채나 질감은 모방할 수 있으나 구성, 개념, 정서적 깊이 등 본질적인 측면에서 한계를 보였음을 밝히고 단일 지표 대신 다각적인 평가 도구의 필요성을 주장합니다.

Anca Dinu, Andreiana Mihail, Andra-Maria Florescu, Claudiu Creanga2026-03-09💬 cs.CL

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

이 논문은 재귀적 자기 개선 과정에서 발생할 수 있는 정렬 편향을 방지하기 위해 목표 편향 지수, 제약 조건 보존 검증, 회귀 위험 정량화라는 세 가지 안전 장치를 도입한 'SAHOO' 프레임워크를 제안하고, 코드 생성 및 추론 등 다양한 작업에서 성능을 향상시키면서도 안전성을 유지하는 것을 입증합니다.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

Evaluation of Deontic Conditional Reasoning in Large Language Models: The Case of Wason's Selection Task

이 논문은 새로운 의무적 조건문 데이터셋을 활용하여 대규모 언어 모델이 인간과 유사하게 의무적 규칙에서 더 나은 추론 능력을 보이며 확인 편향보다는 매칭 편향과 유사한 오류 패턴을 나타낸다는 것을 규명했습니다.

Hirohiko Abe, Kentaro Ozeki, Risako Ando, Takanobu Morishita, Koji Mineshima, Mitsuhiro Okada2026-03-09💬 cs.CL

From Prompting to Preference Optimization: A Comparative Study of LLM-based Automated Essay Scoring

본 논문은 영어 제 2 언어 작문 자동 채점 (AES) 을 위해 프롬프팅, 파인튜닝, RAG, 선호도 최적화 등 주요 LLM 기반 접근법들을 통합 벤치마크에서 비교 분석하여, k-SFT 와 RAG 를 결합한 구성이 93% 의 F1 점수로 가장 우수한 성능을 보임을 입증했습니다.

Minh Hoang Nguyen, Vu Hoang Pham, Xuan Thanh Huynh, Phuc Hong Mai, Vinh The Nguyen, Quang Nhut Huynh, Huy Tien Nguyen, Tung Le2026-03-09💬 cs.CL