Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models

본 논문은 16,000 건 이상의 TripAdvisor 리뷰를 분석한 대규모 언어 모델 (LLM) 기반 프레임워크가 기존 지표가 포착하지 못한 항공사 서비스의 미세한 문제와 만족도 하락 원인을 규명하여, 항공 및 관광 산업에 실행 가능한 전략적 통찰을 제공하는 유효한 진단 도구임을 입증합니다.

Ahmed Dawoud, Osama El-Shamy, Ahmed Habashy2026-03-06💻 cs

Analysis of Terms of Service on Social Media Platforms: Consent Challenges and Assessment Metrics

본 연구는 13 개 주요 소셜 미디어 플랫폼의 이용약관을 분석하여 동의 관련 정보가 명확히 전달되지 않는 문제를 규명하고, 텍스트 접근성, 의미 투명성, 인터페이스 설계를 평가하는 3 차원 프레임워크를 제안함으로써 이용약관을 단순한 동의 문서가 아닌 사용자의 데이터 관행에 대한 동의 조건을 형성하는 문서로 재정의합니다.

Yong-Bin Kang, Anthony McCosker2026-03-06💻 cs

Evaluating and Correcting Human Annotation Bias in Dynamic Micro-Expression Recognition

이 논문은 문화적 배경에 따른 인간 주석 편향을 줄이고 마이크로표정 인식 성능을 향상시키기 위해, 오프셋 프레임의 불확실성을 해결하는 새로운 전역 반단조 차분 선택 전략 (GAMDSS) 아키텍처를 제안하고 이를 통해 다문화 데이터셋에서 주관적 오류를 효과적으로 감소시켰음을 보여줍니다.

Feng Liu, Bingyu Nan, Xuezhong Qian + 1 more2026-03-06💻 cs

Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses

이 논문은 890 개의 결과를 메타 분석하여 단답형 채점에서 LLM 의 성능이 인간 전문가의 난이도 인식과 무관하며, 디코더 전용 아키텍처가 인코더보다 현저히 낮고 토크나이저 어휘 크기 증가에도 한계가 있으며, 고위험 교육 맥락에서 인종 차별적 편향이 발생할 수 있음을 규명했습니다.

Michael Hardy2026-03-06💬 cs.CL

Small Changes, Big Impact: Demographic Bias in LLM-Based Hiring Through Subtle Sociocultural Markers in Anonymised Resumes

이 논문은 이름 등 명시적 개인 식별 정보를 제거한 이력서에서도 언어, 취미, 봉사 활동과 같은 미묘한 사회문화적 표지가 인종과 성별의 대용물이 되어 LLM 기반 채용 과정에서 체계적인 편향을 유발하고, 특히 설명을 요구하는 프롬프팅이 이러한 편향을 더욱 악화시킨다는 사실을 싱가포르 맥락의 대규모 실험을 통해 규명했습니다.

Bryan Chen Zhengyu Tan, Shaun Khoo, Bich Ngoc Doan + 3 more2026-03-06💻 cs

Cognitive Warfare: Definition, Framework, and Case Study

이 논문은 현대 분쟁의 핵심 요소인 인지전의 불명확한 정의를 명확히 하고, OODA 루프에 기반한 상호작용 프레임워크와 측정 가능한 우월성 속성을 제시하며, 이를 가상의 사례를 통해 적용함으로써 작전 지휘관과 분석가들이 인지전 캠페인을 이해·비교·평가할 수 있는 실용적 기반을 마련합니다.

Bonnie Rushing, William Hersch, Shouhuai Xu2026-03-06💻 cs

The role of spatial scales in assessing urban mobility models

본 연구는 중력, 복사, 방문 모델 등 세 가지 도시 이동성 모델의 성능을 다양한 공간 규모에서 평가한 결과, 방문 모델이 전반적으로 우수하지만 모든 모델이 부진한 규모에서는 방문 모델의 성능 저하가 가장 두드러지며, 기존 행정구역보다 거리 기반 군집화가 더 적합한 평가 기준임을 밝혔습니다.

Rakhi Manohar Mepparambath, Hoai Nguyen Huynh2026-03-06🔬 physics

RLVER: Reinforcement Learning with Verifiable Emotion Rewards for Empathetic Agents

이 논문은 시뮬레이션된 사용자로부터 검증 가능한 감정 보상을 활용하여 LLM 의 공감 능력을 극대화하는 새로운 강화학습 프레임워크인 RLVER 를 제안하고, 이를 통해 Qwen2.5-7B-Instruct 모델의 공감 벤치마크 점수를 13.3 에서 79.2 로 획기적으로 향상시키면서도 수학적 및 코딩 능력을 유지하는 결과를 입증합니다.

Peisong Wang, Ruotian Ma, Bang Zhang + 13 more2026-03-05🤖 cs.AI

Dutch Metaphor Extraction from Cancer Patients' Interviews and Forum Data using LLMs and Human in the Loop

이 논문은 암 환자 인터뷰 및 포럼 데이터를 기반으로 대규모 언어 모델 (LLM) 과 인간 개입 방식을 결합하여 네덜란드어 은유를 추출하고 'HealthQuote.NL' 코퍼스를 구축함으로써 환자-임상진 간 소통 개선과 맞춤형 치료 경로 설계에 기여하는 방안을 제시합니다.

Lifeng Han, David Lindevelt, Sander Puts + 2 more2026-03-05💬 cs.CL