cs.CY 편의 논문 | Gist.Science

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

이 논문은 소프트웨어 공학에서 규제 준수를 설계 단계에 통합하기 위해 다양한 관점과 산출물을 중심으로 한 '규제 요구사항 공학을 위한 산출물 모델 (AM4RRE)'을 제안하고, 이를 통해 체계적인 규제 요구사항 공학 프로세스 구축을 위한 향후 연구 방향에 대한 피드백을 구하고 있습니다.

Oleksandr KosenkovWed, 11 Ma💻 cs

Benchmarking Political Persuasion Risks Across Frontier Large Language Models

이 논문은 19,145 명을 대상으로 한 실험을 통해 최신 대형 언어 모델 (LLM) 이 기존 정치 광고보다 더 효과적으로 정치적 견해를 설득할 수 있음을 입증하고, 모델별 설득력 차이와 정보 기반 프롬프트의 상반된 영향을 분석하여 프론티어 모델의 설득적 위험을 벤치마킹하는 프레임워크를 제시합니다.

Zhongren Chen, Joshua Kalla, Quan LeWed, 11 Ma💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

이 논문은 기존 심리측정학 기반의 컴퓨터 적응형 검사 (CAT) 를 머신러닝 관점에서 재조명하여 측정 모델, 문항 선정, 문항지 구성, 검사 통제 등 핵심 요소를 최적화하는 방안을 제시하고, 향후 보다 포괄적이고 학제적인 접근을 촉구하는 종합적 조사를 제공합니다.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong ChenTue, 10 Ma🤖 cs.LG

Life Histories of Taboo Knowledge Artifacts

이 논문은 위키백과에서 성 및 건강과 같은 금기 주제에 대한 지식 산물이 어떻게 생성되고 유지되는지 질적·양적 혼합 방법을 통해 분석하여, 이러한 콘텐츠가 갈등 속에서도 견고한 리더십과 참여적 조직, 그리고 새로운 거버넌스를 통해 생존할 수 있음을 규명합니다.

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

Llama-Mob: Instruction-Tuning Llama-3-8B Excels in City-Scale Mobility Prediction

이 논문은 일본 4 개 대도시의 대규모 이동 데이터를 기반으로 Llama-3-8B 모델을 지시 미세조정하여 15 일 이상의 장기 도시 이동성을 예측하는 'Llama-Mob'을 제안하고, 기존 최첨단 기법보다 뛰어난 성능과 단일 도시 학습으로도 다른 도시에 적용 가능한 강력한 제로샷 일반화 능력을 입증했습니다.

Peizhi Tang, Chuang Yang, Tong Xing, Xiaohang Xu, Jiayi Xu, Renhe Jiang, Kaoru SezakiTue, 10 Ma💬 cs.CL

MediTools -- Medical Education Powered by LLMs

본 논문은 대규모 언어 모델 (LLM) 을 활용하여 임상 시뮬레이션, 논문 분석, 의학 뉴스 요약 기능을 제공하는 'MediTools'를 개발하고 의료 전문가 및 학생들의 피드백을 통해 의료 교육 혁신 가능성을 입증한 연구입니다.

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms

이 논문은 K-5 수학 및 독해 평가 문항의 난이도를 예측하기 위해 대규모 언어 모델 (LLM) 을 활용한 직접 추정법과 특징 기반 앙상블 모델 접근법을 비교한 결과, LLM 이 추출한 언어 및 인지 특징을 나무 기반 머신러닝 모델에 입력하는 방식이 가장 높은 예측 정확도를 보였음을 입증했습니다.

Pooya Razavi, Sonya PowersTue, 10 Ma🤖 cs.LG

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

이 논문은 온라인 토론에서 논의를 중단하거나 방향을 전환하는 '중단점 (stopping points)'을 탐지하기 위한 프랑스어 주석 데이터셋 SPOT 과 벤치마크를 소개하며, 이를 통해 CamemBERT 기반의 미세 조정 모델이 지시 기반 LLM 보다 더 우수한 성능을 보임과 동시에 문맥 메타데이터의 중요성을 입증했습니다.

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

이 논문은 웹 기반 디지털 웰빙을 위해 '탐색 - 통찰 - 행동' 치료 패러다임에 부합하는 다중 에이전트 프레임워크인 XInsight 와 이를 평가하기 위한 벤치마크 XInsight-Bench 를 제안하며, 기존 시스템 대비 치료적 일관성, 해석 가능성 및 개입 깊이를 크게 향상시켰음을 보여줍니다.

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

Evaluating AI-Enabled deception vulnerability amongst Sub-Saharan-Africa migrants

본 연구는 서아프리카 이주자들의 AI 기반 사기 취약성을 평가한 결과, 과거 표적 공격 경험이 가장 큰 위험 요인이었으며 AI 콘텐츠 식별 능력과 높은 검증 노력의 행동 특성이 중요한 보호 요인으로 작용함을 밝혔습니다.

Deborah OluwasanyaTue, 10 Ma💻 cs

Building the ethical AI framework of the future: from philosophy to practice

이 논문은 EU AI 법, NIST 위험 관리 프레임워크 등 기존 거버넌스 도구의 한계를 보완하기 위해 AI 수명주기의 각 단계에 결과론·의무론·덕윤리적 사고를 통합한 '3 중 게이트 (성능, 거버넌스, 환경)' 구조를 도입하여 윤리적 원칙을 실행 가능하고 검증 가능한 운영 통제 장치로 전환하는 실용적 AI 거버넌스 프레임워크를 제안합니다.

Jasper Kyle CatapangTue, 10 Ma💻 cs

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

이 논문은 배양 과정 없이 현미경 이미지와 딥러닝을 활용해 수질 안전을 98% 이상 빠르게(\$0.44) 진단하는 'DeepScope' 시스템을 개발하여 기존 테스트의 시간과 비용 문제를 해결하고 높은 정확도를 입증했습니다.

Sanjay SrinivasanTue, 10 Ma🤖 cs.LG

The Potential for an Innovation Winter: Estimating Impact of Federal Research Reductions on Faculty Activity

이 논문은 트럼프 행정부의 2026 년 연방 연구 예산 삭감 제안이 R1 연구 중심 대학들의 교수진 연구 활동에 치명적인 영향을 미쳐 연구 자금이 임계치 이하로 떨어지는 '혁신의 겨울'을 초래할 수 있음을 확률적 모델을 통해 경고하고 있습니다.

Robert A. BrownTue, 10 Ma🔬 physics

Causal Analysis of Author Demographics in Academic Peer Review

이 논문은 530 편의 논문 데이터를 활용한 인과 추론 분석을 통해, 인종, 성별, 소속 기관의 국가 (글로벌 사우스) 가 학술 논문 심사 결과에 통계적으로 유의미한 부정적인 인과적 영향을 미친다는 사실을 규명하고, 이에 대한 공정성 개입의 시급성을 강조합니다.

Uttamasha Anjally Oyshi, Gibson Nkhata, Susan GauchTue, 10 Ma💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

이 논문은 AI 시대의 과학적 소양을 정의하고 K-16+ 교육 환경에서 과학 지식과 추론의 교수·학습·평가 간 일관성을 제고하기 위해 필요한 생성형 AI 의 아키텍처와 도구, 그리고 향후 연구 방향을 제시합니다.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam BiswasTue, 10 Ma💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

이 연구는 80 개 학생 디자인 팀의 반성적 글을 분석하여 생성형 AI 가 브레인스토밍과 정보 통합 등 초기 단계에서 인지적 가속기 역할을 하지만, 맥락 해석과 솔루션 정제에는 '에이전시, 도메인 지식, 상상력, 취향'이라는 4 가지 인간 역량이 필수적임을 보여줍니다.

Qian Huang, King Wang PoonTue, 10 Ma💻 cs

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

이 논문은 생산성과 정렬에 이어 인공지능 연구의 세 번째 목표로서, 대규모 언어 모델을 인간 행동과 문화, 도덕적 추론을 연구하는 과학적 도구로 활용하는 새로운 패러다임을 제시하고 그 방법론과 한계를 탐구합니다.

W. Russell Neuman, Chad ColemanTue, 10 Ma💬 cs.CL

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

이 논문은 Reddit 의 r/Brexit 서브레딧을 분석한 결과, 설득 가능한 사용자의 이탈로 인한 생존 편향과 동질적 사용자 간의 상호작용이 지배적인 에코 챔버 현상이 결합되어 정치적 의견이 강화되고 고정되는 것을 발견했습니다.

Marian-Andrei Rizoiu, Duy Khuu, Andrew Law, Christine LargeronTue, 10 Ma💻 cs

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

이 논문은 네팔 문화적 맥락에서 7 개의 최신 대규모 언어 모델을 대상으로 '이중 지표 편향 평가 (DMBA)' 프레임워크를 적용하여 명시적 동의 편향과 암시적 생성 편향을 분석한 결과, 두 편향 지표 간 상관관계가 약하며 생성 편향이 온도 설정에 따라 비선형적으로 변화함을 규명했습니다.

Ashish Pandey, Tek Raj ChhetriTue, 10 Ma💬 cs.CL

Governance of AI-Generated Content: A Case Study on Social Media Platforms

이 논문은 40 개 주요 소셜 미디어 플랫폼을 분석하여 AI 생성 콘텐츠에 대한 거버넌스가 주로 기존 규칙 위반 및 공개에 집중되어 있으며, 소유권과 수익화 등 더 포괄적이고 미래 지향적인 정책 및 교육 도구의 개발이 필요함을 주장합니다.

Lan Gao, Abani Ahmed, Oscar Chen, Margaux Reyl, Zayna Cheema, Nick Feamster, Chenhao Tan, Kurt Thomas, Marshini ChettyTue, 10 Ma💻 cs

← 이전 다음 →