SycoEval-EM: Sycophancy Evaluation of Large Language Models in Simulated Clinical Encounters for Emergency Care

이 논문은 응급의료 시뮬레이션 환경에서 다양한 대형 언어 모델이 환자의 부적절한 요구에 얼마나 쉽게 acquiescence(순응) 하는지 평가하는 'SycoEval-EM' 프레임워크를 제시하며, 정적 벤치마크만으로는 사회적 압력 하의 안전성을 예측하기 어렵고 다중 턴 적대적 테스트가 필요함을 입증했습니다.

Dongshen Peng, Yi Wang, Austin Schoeffler + 2 more2026-03-05🤖 cs.AI

Comparative Study of Ultrasound Shape Completion and CBCT-Based AR Workflows for Spinal Needle Interventions

본 연구는 척추 바늘 중재 수술을 위한 초음파 모양 완성 기반과 CBCT 기반의 증강현실 (AR) 워크플로우를 비교한 결과, CBCT 기반이 계획 및 삽입 효율성과 정확도, 사용자 신뢰도에서 우위를 보였으나 초음파 기반이 방사선 노출 없이 적응형 업데이트가 가능하므로 두 방식을 결합한 하이브리드 AR 가이드가 유망함을 제시했습니다.

Tianyu Song, Feng Li, Felix Pabst + 4 more2026-03-05💻 cs

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

이 논문은 EEG 신호에서 자연어를 해독할 때 발생하는 의미 편향과 신호 무시 문제를 해결하기 위해, 감성·주제·길이·놀라움이라는 네 가지 분리된 의미 목표를 통해 신경 입력에 기반한 생성을 강제하는 'SemKey' 프레임워크를 제안하고, 기존 BLEU 점수의 한계를 넘어 N-way 검색 정확도 및 프라체트 거리와 같은 새로운 평가 지표를 통해 모델의 성능을 입증합니다.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

Arapai: An Offline-First AI Chatbot Architecture for Low-Connectivity Educational Environments

이 논문은 인터넷 연결이 제한된 교육 환경을 위해 저사양 CPU 장치에서 완전히 오프라인으로 작동하며 자동 하드웨어 인식 모델 선택과 교육적 응답 제어를 통해 디지털 격차를 해소하는 '아라파이 (Arapai)'라는 AI 챗봇 아키텍처를 제안하고 그 유효성을 검증합니다.

Joseph Walusimbi, Ann Move Oguti, Joshua Benjamin Ssentongo + 1 more2026-03-05💬 cs.CL

Bridging Pedagogy and Play: Introducing a Language Mapping Interface for Human-AI Co-Creation in Educational Game Design

이 논문은 교육적 의도를 명시적으로 표현하고 수정할 수 있는 구조화된 자연어 인터페이스를 통해 비전문가 설계자가 AI 와 협력하여 교육적 목표와 게임플레이를 효과적으로 정렬할 수 있도록 돕는 새로운 도구와 프레임워크를 제안합니다.

Daijin Yang, Erica Kleinman, Casper Harteveld2026-03-05🤖 cs.AI

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

이 논문은 배달과 도시 감지라는 이질적인 도시 서비스를 공동 최적화하기 위해 인간과 로봇의 협력을 위한 2 층 프레임워크인 'UrbanHuRo'를 제안하고, 이를 통해 감지 커버리지와 배달원 소득을 각각 29.7% 와 39.2% 향상시키며 지연 주문을 획기적으로 줄인다는 것을 입증했습니다.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

FeedAIde: Guiding App Users to Submit Rich Feedback Reports by Asking Context-Aware Follow-Up Questions

본 논문은 멀티모달 대규모 언어 모델의 추론 능력을 활용하여 사용자의 스크린샷 등 맥락 정보를 기반으로 적응형 후속 질문을 통해 개발자에게 유용한 풍부한 피드백 보고서를 생성하도록 돕는 'FeedAIde'를 제안하고, 이를 통해 사용자 경험과 개발자 정보 가치 모두를 향상시켰음을 실증합니다.

Ali Ebrahimi Pourasad, Meyssam Saghiri, Walid Maalej2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

이 논문은 사용자가 앱의 UI 개선 사항을 불만 대신 구체적인 제안으로 제출할 수 있도록 돕기 위해, 사용자 코멘트와 스크린샷을 기반으로 개선안을 생성하는 GenAI 기반 접근법인 'LikeThis!'를 제안하고, 벤치마크 및 사용자 연구를 통해 개발자와 사용자 양측의 관점에서 피드백의 질을 향상시켰음을 입증합니다.

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI