Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

이 논문은 소프트웨어 공학에서 규제 준수를 설계 단계에 통합하기 위해 다양한 관점과 산출물을 중심으로 한 '규제 요구사항 공학을 위한 산출물 모델 (AM4RRE)'을 제안하고, 이를 통해 체계적인 규제 요구사항 공학 프로세스 구축을 위한 향후 연구 방향에 대한 피드백을 구하고 있습니다.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

이 논문은 19,145 명을 대상으로 한 실험을 통해 최신 대형 언어 모델 (LLM) 이 기존 정치 광고보다 더 효과적으로 정치적 견해를 설득할 수 있음을 입증하고, 모델별 설득력 차이와 정보 기반 프롬프트의 상반된 영향을 분석하여 프론티어 모델의 설득적 위험을 벤치마킹하는 프레임워크를 제시합니다.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

이 논문은 기존 심리측정학 기반의 컴퓨터 적응형 검사 (CAT) 를 머신러닝 관점에서 재조명하여 측정 모델, 문항 선정, 문항지 구성, 검사 통제 등 핵심 요소를 최적화하는 방안을 제시하고, 향후 보다 포괄적이고 학제적인 접근을 촉구하는 종합적 조사를 제공합니다.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

이 논문은 일본 4 개 대도시의 대규모 이동 데이터를 기반으로 Llama-3-8B 모델을 지시 미세조정하여 15 일 이상의 장기 도시 이동성을 예측하는 'Llama-Mob'을 제안하고, 기존 최첨단 기법보다 뛰어난 성능과 단일 도시 학습으로도 다른 도시에 적용 가능한 강력한 제로샷 일반화 능력을 입증했습니다.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

이 논문은 K-5 수학 및 독해 평가 문항의 난이도를 예측하기 위해 대규모 언어 모델 (LLM) 을 활용한 직접 추정법과 특징 기반 앙상블 모델 접근법을 비교한 결과, LLM 이 추출한 언어 및 인지 특징을 나무 기반 머신러닝 모델에 입력하는 방식이 가장 높은 예측 정확도를 보였음을 입증했습니다.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

이 논문은 온라인 토론에서 논의를 중단하거나 방향을 전환하는 '중단점 (stopping points)'을 탐지하기 위한 프랑스어 주석 데이터셋 SPOT 과 벤치마크를 소개하며, 이를 통해 CamemBERT 기반의 미세 조정 모델이 지시 기반 LLM 보다 더 우수한 성능을 보임과 동시에 문맥 메타데이터의 중요성을 입증했습니다.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

이 논문은 웹 기반 디지털 웰빙을 위해 '탐색 - 통찰 - 행동' 치료 패러다임에 부합하는 다중 에이전트 프레임워크인 XInsight 와 이를 평가하기 위한 벤치마크 XInsight-Bench 를 제안하며, 기존 시스템 대비 치료적 일관성, 해석 가능성 및 개입 깊이를 크게 향상시켰음을 보여줍니다.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Building the ethical AI framework of the future: from philosophy to practice

이 논문은 EU AI 법, NIST 위험 관리 프레임워크 등 기존 거버넌스 도구의 한계를 보완하기 위해 AI 수명주기의 각 단계에 결과론·의무론·덕윤리적 사고를 통합한 '3 중 게이트 (성능, 거버넌스, 환경)' 구조를 도입하여 윤리적 원칙을 실행 가능하고 검증 가능한 운영 통제 장치로 전환하는 실용적 AI 거버넌스 프레임워크를 제안합니다.

Jasper Kyle CatapangTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

이 논문은 AI 시대의 과학적 소양을 정의하고 K-16+ 교육 환경에서 과학 지식과 추론의 교수·학습·평가 간 일관성을 제고하기 위해 필요한 생성형 AI 의 아키텍처와 도구, 그리고 향후 연구 방향을 제시합니다.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

이 논문은 네팔 문화적 맥락에서 7 개의 최신 대규모 언어 모델을 대상으로 '이중 지표 편향 평가 (DMBA)' 프레임워크를 적용하여 명시적 동의 편향과 암시적 생성 편향을 분석한 결과, 두 편향 지표 간 상관관계가 약하며 생성 편향이 온도 설정에 따라 비선형적으로 변화함을 규명했습니다.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

이 논문은 40 개 주요 소셜 미디어 플랫폼을 분석하여 AI 생성 콘텐츠에 대한 거버넌스가 주로 기존 규칙 위반 및 공개에 집중되어 있으며, 소유권과 수익화 등 더 포괄적이고 미래 지향적인 정책 및 교육 도구의 개발이 필요함을 주장합니다.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs