cs.LG 편의 논문 | Gist.Science

Improving Conditional VAE with Non-Volume Preserving transformations

이 논문은 가변적 잠재 공간 분포를 추정하기 위해 비부피 보존 (NVP) 변환을 도입하여 기존 조건부 VAE 의 흐릿함과 다양성 부족 문제를 해결하고, FID 를 4% 감소시키고 로그 가능도를 7.6% 향상시킨 이미지 생성 방법을 제안합니다.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

이 논문은 $\ell_0$ 공격의 볼록 쉘을 정확히 계산하는 새로운 선형 경계 전파 기법을 제안하여 기존 $\ell_0$ 검증기의 성능을 3.16 배 (기하평균) 향상시켰습니다.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

이 논문은 쌍곡선 공간의 기하학적 특성을 활용하여 접선 공간의 기울기를 반경 방향과 각도 방향으로 분해하고, 의미적 민감도가 높은 각도 방향의 왜곡만을 적용하여 기존 방법보다 더 높은 공격 성공률을 달성하는 'Angular Gradient Sign' 방법을 제안합니다.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

이 논문은 실제 적용 가능성이 낮은 기존 'k-불안정' 가정을 넘어, 다양한 조크브레이킹 공격에 대한 더 현실적인 확률적 안전성 보장을 제공하는 '(k, $\varepsilon$ )-불안정' 프레임워크를 제안하여 SmoothLLM 방어 메커니즘의 신뢰성을 높입니다.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

이 논문은 심리학적 '발문법 (Foot-in-the-Door)' 기법을 자동화하여 대규모 멀티턴 LLM 재일브레이크 데이터셋을 구축하고, 이를 통해 GPT 계열 모델이 대화 맥락에 취약한 반면 Gemini 2.5 Flash 는 높은 방어력을 보임을 규명한 연구입니다.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

이 논문은 의료 영상 등 실제 환경에서shortcut-label 이나 shortcut-충돌 샘플 없이도, 해리된 잠재 공간에서 타겟된 아노트로픽 노이즈를 주입하여 분류기의 민감도를 정규화함으로써 OOD 일반화 성능을 획기적으로 개선하는 'Shortcut Invariance' 방법을 제안합니다.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

이 논문은 Kaggle 경진대회를 통해 다양한 머신러닝 아키텍처를 확보하고 이를 기후 모델에 통합한 결과, 저해상도 환경에서도 온라인 안정성을 재현할 수 있으며 일부 메트릭에서 최첨단 성능을 달성하여 하이브리드 물리-AI 기후 시뮬레이션의 발전 가능성을 입증했습니다.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

이 논문은 인과 추론 과정에서 서로 다른 가설 간의 내적 대화를 외부화하기 위해 구조적 추론과 비판적 검토를 수행하는 두 에이전트가 논쟁을 통해 결론을 도출하는 'CRAwDAD' 프레임워크를 제안하며, CLadder 벤치마크에서 강력한 추론 모델들의 인과 추론 정확도를 크게 향상시키는 효과를 입증합니다.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

이 논문은 2D 마이크로 CT 슬라이스를 기반으로 한 심층 학습 파이프라인 'ForamDeepSlice'를 제안하여 27 종의 유공충을 95.64% 의 높은 정확도로 자동 분류하고, 실시간 분류 및 3D 슬라이스 매칭을 지원하는 대시보드를 개발함으로써 AI 기반 미고생물학 식별의 새로운 기준을 제시합니다.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

이 논문은 안전이 중요한 환경에서 성능 저하 없이 강화학습의 가소성 손실 문제를 해결하기 위해, 학습과 재학습을 번갈아 수행하는 쌍둥이 신경망 구조인 'AltNet'을 제안하고 이를 통해 샘플 효율성과 성능을 동시에 향상시켰음을 보여줍니다.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

본 논문은 불규칙한 기하학적 구조를 효율적으로 처리하는 볼 트리 (ball trees) 를 활용하여 국소적 상호작용과 전역적 의존성을 동시에 포착하는 '다중 스케일 패치 트랜스포머 (MSPT)'를 제안함으로써, 단일 GPU 에서 수백만 개의 공간 요소를 처리하면서도 기존 물리 시뮬레이션 방법보다 우수한 정확도와 낮은 계산 비용을 달성함을 보여줍니다.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

이 논문은 전역 노이즈 분산의 한계를 극복하고 다양한 반경에서 강력한 인증된 강인성을 달성하기 위해 입력별 노이즈 분산을 예측하는 '이중 무작위 평활화 (Dual Randomized Smoothing)' 프레임워크를 제안합니다.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

이 논문은 교차 도메인 오프라인 강화학습에서 훈련 및 테스트 시간의 역동적 변화에 대한 이중 강인성을 보장하기 위해 새로운 로버스트 벨만 연산자와 보정 기법을 도입한 DROCO 알고리즘을 제안하고 그 우수성을 입증합니다.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

이 논문은 최적화와 생성 과정을 분리하여 온라인 강화학습에서 발생하는 안정성과 표현력 간의 긴장 관계를 해결하고, 잠재 공간에서 정책 최적화를 수행하는 새로운 프레임워크인 GoRL 을 제안하여 다양한 연속 제어 작업에서 기존 방법론을 크게 능가하는 성능을 입증합니다.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

이 논문은 비선형적 보상 함수와 고차원 환경에서 기존 샤플리 값의 한계를 극복하기 위해, 단조 변환 학습과 L0 희소성 제약을 통합한 '희소 등방성 샤플리 회귀 (SISR)' 프레임워크를 제안하여 정확한 특성 기여도 해석을 가능하게 합니다.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

이 논문은 제한된 자원과 데이터 제약 하에 개발된 2 단계 생성적 데이터 증강 기법을 통해 가짜 마스크를 실제와 유사하게 변환하여 마스크 착용 얼굴 탐지 및 인식 성능을 향상시키는 방법을 제안합니다.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

이 논문은 SALVE 라는 프레임워크를 제안하여 희소 오토인코더와 그라디언트 기반 시각화 기법을 결합해 신경망의 특징을 발견하고 검증하며, 이를 통해 모델의 가중치 공간을 정밀하게 편집하여 AI 시스템의 투명성과 제어 가능성을 높이는 방법을 제시합니다.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

이 논문은 RL 기반 언어 에이전트의 탐색 부족 문제를 해결하기 위해 에피소드 간 학습과 인-컨텍스트 정책 적응을 통해 환경 피드백을 실시간으로 활용하는 메타-RL 프레임워크 'LaMer'를 제안하고, 다양한 환경에서 기존 RL 베이스라인보다 우수한 성능과 일반화 능력을 입증했습니다.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

이 논문은 기초 모델과 대규모 2D 확산 모델의 강점을 결합하여, 깊이 지도를 재조명하고 입력 이미지를 증강하는 자기지도 학습 프레임워크인 'Re-Depth Anything'을 제안함으로써 단안 깊이 추정의 도메인 격차를 해소하고 정밀도와 현실감을 획기적으로 향상시킨다고 설명합니다.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

이 논문은 순차적 업데이트의 병렬화 한계를 극복하기 위해 뉴턴-카츠마르츠 기반의 콜모고로프-아르놀드 네트워크 (KAN) 학습 알고리즘에 사전 학습, 불연속 데이터 세트를 활용한 병렬 학습 및 FPGA 구현 등 세 가지 동시성 향상 전략을 제안하고 실험적으로 검증합니다.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG