cs 편의 논문 | Gist.Science

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

이 논문은 코드 분석을 위한 단일 모델의 다중 태스크 파라미터 효율적 미세 조정 (PEFT) 을 체계적으로 평가하여, 단일 태스크 미세 조정과 유사한 성능을 유지하면서 저장 공간과 계산 비용을 대폭 절감할 수 있음을 입증하고, 작업 간 상호 보완성 및 모델 아키텍처 등 성공 요인을 규명했습니다.

Amal Akli, Maxime Cordy, Mike Papadakis, Yves Le Traon2026-03-12💻 cs

Open Educational Resources: Barriers and Open Issues

이 논문은 OER(개방형 교육 자원) 의 채택과 지속적 사용을 방해하는 26 가지의 사회·경제·기술적 장벽을 식별하고 전문가 인터뷰를 통해 검증하여, 포용적인 교육 생태계 구축을 위한 전략과 정책 수립에 기여하는 개념 모델을 제시합니다.

Pedro Henrique Dias Valle, Rafael Capilla, Vinicius dos Santos, Daniel Feitosa, Elisa Yumi Nakagawa2026-03-12💻 cs

$\mu$ Ed API: Towards A Shared API for EdTech Microservices

이 논문은 대규모 학습 환경에서 특정 도메인의 자동화를 가능하게 하고 상호 운용 가능한 에코시스템을 구축하기 위해 4 개 기관의 기존 시스템 기능을 통합한 교육용 마이크로서비스 표준 API( $\mu$ Ed) 의 초기 사양을 제안합니다.

Maximillan Sölch, Alexandra Neagu, Marcus Messer, Peter Johnson, Gerd Kortemeyer, Samuel S. H. Ng, Fun Siong Lim, Stephan Krusche2026-03-12💻 cs

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

본 논문은 5 개의 대규모 언어 모델을 대상으로 사법 판결 지원 맥락에서 '덕스러운 피해자 효과'와 '후광 효과'가 인간과 유사하게 나타나는지 실험한 결과, 모델 간 편차는 있으나 인간 기준 대비 소폭 개선된 편향을 보였음을 밝혔습니다.

Sierra S. Liu2026-03-12💻 cs

The science and practice of proportionality in AI risk evaluations

이 논문은 EU 인공지능법 하에서 일반 목적 AI 모델 제공자에게 부과된 시스템적 위험 평가 의무가 혁신을 저해하지 않으면서도 실효적인 위험 정보를 제공할 수 있도록, EU 법의 비례성 원칙을 기반으로 한 과학적 평가 방법론의 개발 필요성과 실천 방안을 논의합니다.

Carlos Mougan, Lauritz Morlock, Jair Aguirre, James R. M. Black, Jan Brauner, Simeon Campos, Sunishchal Dev, David Fernández Llorca, Alberto Franzin, Mario Fritz, Emilia Gómez, Friederike Grosse-Holz, Eloise Hamilton, Max Hasin, Jose Hernandez-Orallo, Dan Lahav, Luca Massarelli, Vasilios Mavroudis, Malcolm Murray, Patricia Paskov, Jaime Raldua, Wout Schellaert2026-03-12💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

이 논문은 대규모 언어 모델 (LLM) 의 사용자의 견해에 미치는 영향을 평가하기 위해 deliberative opinion polling 과정을 표준으로 삼은 'DeliberationBench'를 제안하고, 4,088 명의 미국 참가자를 대상으로 한 실험을 통해 해당 모델들이 민주적으로 정당한 기준에 부합하며 사용자의 자율성을 해치지 않는 긍정적인 인식적 영향을 미친다는 것을 입증했습니다.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

본 논문은 AI 가 신격화되어 'GPTheology'라는 새로운 기술 종교가 등장하는 현상을 분석하고, 온라인 커뮤니티와 실제 사례를 통해 AI 와 종교의 결합이 가져오는 철학적, 사회적, 윤리적 함의를 조명합니다.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

Dark Patterns and Consumer Protection Law for App Makers

이 논문은 앱 개발자가 선택 아키텍처와 투명한 설계 원칙을 통해 의도적이든 비의도적이든 발생할 수 있는 다크 패턴을 방지하고, 소비자 보호법 위반을 막으며 사용자 신뢰를 구축할 수 있는 전략을 제시합니다.

Gregory M. Dickinson2026-03-12💻 cs

Law Proofing the Future

이 논문은 새로운 기술에 대응하기 위해 법을 강화해야 한다는 주류적 견해와 반대로, 오히려 법이 기술 발전을 저해하지 않도록 현행의 일반적 법원칙을 유지하고 사법적 판단에 의존하는 '적극적 자제'가 미래와 자유를 보호하는 최선의 길이라고 주장합니다.

Gregory M. Dickinson2026-03-12💻 cs

Consumer Rights and Algorithms

이 논문은 소비자 보호법의 역사적 기원과 현대적 도전을 요약하고, 인공지능과 빅데이터가 디지털 광고 및 사기에 미치는 영향을 분석하며, 데이터 프라이버시 법규와 다크 패턴 금지 등 새로운 규제 대응과 그 내재된 트레이드오프를 탐구합니다.

Gregory M. Dickinson2026-03-12💻 cs

A Review of the Negative Effects of Digital Technology on Cognition

이 논문은 500 여 건의 실증 연구를 종합하여 디지털 기술, 특히 생성형 AI 가 주의력 분산과 고차원적 사고 능력의 퇴색을 초래할 수 있으며, 이는 사회경제적 요인에 의해 조절되고 장기적인 인지 건강에 부정적 영향을 미칠 수 있음을 제시합니다.

Urška Žnidarič, Erik Štrumbelj, Octavian Machidon2026-03-12💻 cs

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

이 논문은 이론적 근거가 부족한 기존 ToM 벤치마크의 한계를 극복하기 위해 양자적 반응 균형 (QRE) 을 기반으로 한 게임 이론적 평가 프레임워크를 제안하고, 이를 통해 다양한 대규모 언어 모델의 전략적 추론 능력을 인간 데이터에 기반한 연속적 척도로 정량화하고 검증했습니다.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Tureis 는 스마트 홈 IoT 환경에서 라벨 없이 자가 지도 학습을 통해 다중 고장과 다중 거주자 상황을 실시간으로 감지하고 정밀하게 국소화할 수 있는 경량 트랜스포머 기반의 통합 복원력 프레임워크입니다.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

이 논문은 NetSecGame 환경에서 IP 주소 재배치와 같은 미세한 변화가 자율 공격 에이전트의 일반화 능력을 어떻게 저해하는지 평가하고, 기존 강화학습 및 적응형 에이전트보다 추론 비용과 투명성 문제가 있음에도 불구하고 프롬프트 기반 사전 훈련 LLM 에이전트가 가장 높은 성공률을 보였음을 밝혔습니다.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

이 논문은 3D 공간의 에너지 함수로 표현된 다양한 안내 소스를 활용하여 복잡한 작업에서 시각 - 언어 - 행동 (VLA) 모델의 성능과 안전성을 획기적으로 향상시키는 범용 프레임워크인 '오미가이드 (OmniGuide)'를 제안합니다.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

OAuthHub 는 사용자의 개인 기기를 중개자로 활용하여 OAuth 기반 데이터 공유를 제어하고, 필요한 시점에 맞춰 데이터 접근을 제한함으로써 기존 방식보다 개발 효율성을 높이고 불필요한 데이터 접근을 완화하는 새로운 개발 프레임워크를 제안합니다.

Qiyu Li, Yuhe Tian, Haojian Jin2026-03-12💻 cs

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

이 논문은 물리적 시뮬레이션 모델 없이 데이터만으로 유연한 센서의 배치와 변형 예측 네트워크를 함께 최적화하여 제조 가능성과 예측 정확도를 동시에 향상시키는 모델 프리 코-최적화 프레임워크를 제안합니다.

Yingjun Tian, Guoxin Fang, Aoran Lyu, Xilong Wang, Zikang Shi, Yuhu Guo, Weiming Wang, Charlie C. L. Wang2026-03-12💻 cs

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

이 논문은 인간 - 로봇 상호작용에서 부분적 관측 하의 시각 - 언어 모델 기반 행동 예측에 대한 불확실성을 체계적으로 평가하기 위한 새로운 프로토콜과 지표를 제안하고, 신뢰할 수 있는 예측을 위한 검증 근거를 마련합니다.

Zhaoda Du, Michael Bowman, Qiaojie Zheng, Xiaoli Zhang2026-03-12💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

이 논문은 개인 정보 보호 및 규제 준수를 위해 인증, 권한 부여, 감사 기능을 통합한 새로운 연동 학습 플랫폼 'FLA³'를 제안하고, 이를 다국적 의료 연구에 적용하여 중앙 집중식 학습과 동등한 예측 성능을 유지하면서도 엄격한 거버넌스 제약을 준수할 수 있음을 입증했습니다.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael Roberts2026-03-12💻 cs

Categorical Calculus and Algebra for Multi-Model Data

이 논문은 관계형 연산과 미적분을 확장하여 범주형 데이터베이스를 위한 두 가지 형식적 쿼리 언어 (범주형 미적분과 범주형 대수) 를 제안하고, 이들의 동등성, 최적화를 위한 변환 규칙, 그리고 표현력과 계산 복잡성을 분석합니다.

Jiaheng Lu (University of Helsinki)2026-03-12💻 cs

← 이전 다음 →

cs

One Model, Many Skills: Parameter-Efficient Fine-Tuning for Multitask Code Analysis

Open Educational Resources: Barriers and Open Issues

μ\muμEd API: Towards A Shared API for EdTech Microservices

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

The science and practice of proportionality in AI risk evaluations

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Prompts and Prayers: the Rise of GPTheology

Dark Patterns and Consumer Protection Law for App Makers

Law Proofing the Future

Consumer Rights and Algorithms

A Review of the Negative Effects of Digital Technology on Cognition

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Categorical Calculus and Algebra for Multi-Model Data

$\mu$ Ed API: Towards A Shared API for EdTech Microservices