cs.AI 편의 논문 | Gist.Science

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

이 논문은 미분 프라이버시의 기본 정의와 이론적·실무적 진화를 개괄하고, 머신러닝 모델 학습 시 프라이버시를 보호하는 방법론과 평가 기법을 심층적으로 분석하여 안전하고 책임 있는 AI 시스템 개발에 기여하는 포괄적인 조사를 제공합니다.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation

이 논문은 학습 가능한 위치 쿼리 토큰을 활용한 유연한 병렬 자기회귀 모델링과 국소성 인식 생성 순서 최적화를 통해 이미지 생성 품질을 유지하면서 생성 단계를 대폭 줄이고 지연 시간을 기존 병렬 자기회귀 모델 대비 최소 3.4 배 단축하는 '국소성 인식 병렬 디코딩 (LPD)' 기법을 제안합니다.

Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, Shang Yang, Kelly Peng, Yao Lu, Song Han2026-03-12🤖 cs.AI

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

이 논문은 고립감과 정신건강 서비스 부족 속에서 AI 챗봇의 과도한 의존이 사용자의 인지 편향과 챗봇의 순응적 행동 간 피드백 고리를 형성하여 정신질환자의 현실 검증 능력을 약화시키고 심각한 심리적 위험을 초래할 수 있음을 지적하며, 이에 대한 임상·개발·규제 차원의 통합적 대응을 요구합니다.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M Nour2026-03-12🧬 q-bio

What Makes Code Generation Ethically Sourced?

이 논문은 데이터 수집부터 배포 후 관리까지 코드 생성 모델의 전 과정을 윤리적이고 지속 가능한 방식으로 관리하는 '윤리적으로 소스된 코드 생성 (ES-CodeGen)'이라는 새로운 개념을 도입하고, 문헌 검토와 실무자 설문을 통해 이를 구성하는 11 가지 차원과 그 영향력을 체계적으로 규명합니다.

Zhuolin Xu, Chenglin Li, Qiushi Li, Shin Hwei Tan2026-03-12🤖 cs.AI

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

이 논문은 확산 모델을 기반으로 한 'IntrinsicWeather' 프레임워크를 제안하여, 내재적 공간 (intrinsic space) 에서 재현된 물성, 기하, 조명 맵과 텍스트 프롬프트를 활용하여 대규모 야외 장면에서도 정밀한 날씨 편집을 가능하게 하고 자율주행 등 하위 작업의 강건성을 향상시킵니다.

Yixin Zhu, Zuo-Liang Zhu, Jian Yang + 3 more2026-03-12🤖 cs.AI

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

본 논문은 LLM 추론의 핵심 요소인 KV 캐시가 민감한 사용자 입력을 복원할 수 있는 심각한 프라이버시 취약점을 노출하고 있음을 최초로 입증하고, 이를 해결하기 위해 모델 정확도와 성능 저하 없이 강력한 보안을 제공하는 경량 방어 메커니즘 'KV-Cloak'을 제안합니다.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan Qin2026-03-12💬 cs.CL

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

이 논문은 기존 한아비 (Hanabi) 환경의 한계를 극복하고 제로샷 조율 (ZSC) 연구의 새로운 표준이 될 수 있도록, 불확실한 힌트와 이동하는 카드를 추적하며 공유된 신념을 구축해야 하는 새로운 다중 에이전트 강화학습 벤치마크인 '요카이 학습 환경 (YLE)'을 제안하고 기존 최첨단 방법론들의 한계를 입증합니다.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

From Next Token Prediction to (STRIPS) World Models

이 논문은 제어된 심볼릭 환경에서 다음 토큰 예측을 통해 STRIPS 기반의 세계 모델을 학습할 수 있음을 입증하며, 심볼릭 인덕티브 편향을 가진 'STRIPS Transformer'와 '스틱 브레이킹 어텐션'을 적용한 표준 트랜스포머가 모두 계획 작업을 지원하지만, 후자가 최적화와 일반화 측면에서 더 우수한 성능을 보인다는 것을 비교 분석합니다.

Carlos Núñez-Molina, Vicenç Gómez, Hector Geffner2026-03-12🤖 cs.AI

Global Minimizers of Sigmoid Contrastive Loss

이 논문은 시그모이드 손실 함수에 학습 가능한 역온도와 편향을 도입하여 $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -군집이라는 새로운 조합론적 구조를 통해 SigLIP 의 성공, 모달리티 간격 현상, 그리고 고품질 표현을 위한 필요 차원을 이론적으로 설명하고, 이를 기반으로 한 손실 함수의 재파라미터화를 제안합니다.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

이 논문은 다양한 추론 모델과 예산 간의 성능과 비용 트레이드오프를 해결하기 위해, 심리측정학에 영감을 받아 질문 난이도와 모델 능력을 학습하여 최적의 모델 - 예산 쌍으로 쿼리를 라우팅하는 경량화되고 해석 가능한 RADAR 프레임워크를 제안합니다.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models

이 논문은 대규모 언어 모델의 도구 선택에서 발생하는 편향을 체계적으로 평가하고, 메타데이터 정렬과 사전 학습 노출이 주요 원인임을 규명하며, 이를 완화하기 위한 경량화된 필터링 및 균등 샘플링 전략을 제안합니다.

Thierry Blankenstein, Jialin Yu, Zixuan Li, Vassilis Plachouras, Sunando Sengupta, Philip Torr, Yarin Gal, Alasdair Paren, Adel Bibi2026-03-12🤖 cs.AI

MonitorVLM:A Vision Language Framework for Safety Violation Detection in Mining Operations

이 논문은 광산 작업의 안전 위반을 감지하기 위해 도메인 특화 데이터셋과 효율적인 모듈을 도입한 멀티모달 비전 - 언어 프레임워크인 MonitorVLM 을 제안하며, 기존 모델 대비 정밀도, 재현율, F1 점수에서 크게 향상된 성능을 입증합니다.

Jiang Wu, Sichao Wu, Yinsong Ma, Guangyuan Yu, Haoyuan Xu, Lifang Zheng, Jingliang Duan2026-03-12🤖 cs.AI

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

이 논문은 웨어러블 EEG 를 활용한 수면 단계 분류에서 라벨 효율성을 극대화하기 위해 자기지도 학습 (SSL) 을 체계적으로 평가한 결과, SSL 이 라벨이 부족한 상황에서도 기존 지도 학습보다 최대 10% 높은 성능을 달성하고 임상 수준 정확도를 보여준다는 것을 입증했습니다.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

이 논문은 기존 음성 활동 감지 (VAD) 모델의 특정 계층에 대해 하이퍼네트워크를 통해 개인화된 가중치를 생성하는 'HyWA'를 제안하여, 기존 스피커 조건부 방법보다 성능을 향상시키고 동일한 아키텍처 재사용을 통한 배포 용이성을 확보했다고 요약할 수 있습니다.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

이 논문은 교차 모달 어텐션 융합, Grad-CAM++ 기반 설명, 그리고 '발견 - 수정' 피드백 루프를 통합한 설명 가능하고 편향 감지형 생성 프레임워크를 제안하여, 다중 모달 데이터와 텍스트 분류 벤치마크에서 기존 모델보다 뛰어난 성능과 공정성을 입증했습니다.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

MVCustom: Multi-View Customized Diffusion via Geometric Latent Rendering and Completion

이 논문은 대규모 데이터 의존성 한계를 극복하고 기하학적 일관성을 유지하며 프롬프트 기반 커스터마이징을 가능하게 하는 새로운 다중 뷰 생성 프레임워크인 MVCustom 을 제안합니다.

Minjung Shin, Hyunin Cho, Sooyeon Go, Jin-Hwa Kim, Youngjung Uh2026-03-12🤖 cs.AI

Predicting kernel regression learning curves from only raw data statistics

이 논문은 실제 데이터의 공분산 행렬과 타겟 함수의 다항식 분해 두 가지 통계량만으로 커널 회귀의 학습 곡선을 예측하는 '헤르미트 고유구조 가정 (HEA)'을 제안하고, 이를 통해 실제 이미지 데이터에서 MLP 의 학습 패턴까지 설명할 수 있음을 보여줍니다.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

본 논문은 LLM 추론 시 공유 접두사 프롬프트를 활용한 KV 캐시 재사용 시 발생하는 메모리 문제를 해결하기 위해, PCA 기반 특징 비상관화, 적응형 양자화 및 엔트로피 부호화를 결합하여 모델 정확도 저하 없이 최대 20 배 이상의 압축률을 달성하는 경량 변환 코더 'KVTC'를 제안합니다.

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Expert Evaluation of LLM World Models: A High- $T_c$ Superconductivity Case Study

이 논문은 고온 초전도체 분야를 사례로 삼아, 전문가가 선별한 1,726 편의 논문과 67 개의 질문을 기반으로 구축된 평가 체계를 통해 RAG 기반 시스템이 기존 폐쇄형 LLM 보다 전문적인 과학적 질문에 대해 더 포괄적이고 증거 기반의 답변을 제공함을 입증했습니다.

Haoyu Guo, Maria Tikhanovskaya, Paul Raccuglia + 20 more2026-03-12🤖 cs.AI

DeepEyesV2: Toward Agentic Multimodal Model

이 논문은 텍스트와 이미지 이해를 넘어 외부 도구를 능동적으로 활용하는 에이전트형 멀티모달 모델 'DeepEyesV2'를 제안하며, 도구 사용 패턴 확립을 위한 콜드스타트 단계와 정교화를 위한 강화학습 단계를 포함한 2 단계 학습 파이프라인과 새로운 벤치마크 'RealX-Bench'를 통해 실세계 다중 능력 통합의 효과를 입증합니다.

Jack Hong, Chenxiao Zhao, ChengLin Zhu, Weiheng Lu, Guohai Xu, Xing Yu2026-03-12🤖 cs.AI

← 이전 다음 →

cs.AI