cs.LG 편의 논문 | Gist.Science

Certified and accurate computation of function space norms of deep neural networks

이 논문은 구간 산술, 적응적 세분화 및 수치 적분을 결합하여 신경망 구조를 직접 활용함으로써 함수 공간 노름 (Lebesgue 및 Sobolev 노름) 과 PINN 잔차에 대한 검증 가능하고 정확한 계산을 위한 프레임워크를 제시합니다.

Johannes Gründler, Moritz Maibaum, Philipp Petersen2026-03-09🤖 cs.LG

Toward Generative Quantum Utility via Correlation-Complexity Map

이 논문은 양자 상관성 유사도 지표 (QCLI) 와 고전적 상관 복잡도 지표 (CCI) 로 구성된 상관 - 복잡성 맵을 제안하여 실제 데이터가 IQP 양자 생성 모델과 구조적으로 정렬되었는지 진단하고, 이를 통해 난류 데이터에 대해 고전적 모델보다 적은 자원으로 경쟁력 있는 분포 정렬을 달성하는 양자 생성 유틸리티 실현 가능성을 입증했습니다.

Chen-Yu Liu, Leonardo Placidi, Eric Brunner, Enrico Rinaldi2026-03-09⚛️ quant-ph

Quantum Diffusion Models: Score Reversal Is Not Free in Gaussian Dynamics

이 논문은 양자 한계 감쇠기에서 가우시안 역확산 과정을 수행할 때 고정된 확산을 가진 역방향 드리프트가 완전 양성 (CP) 을 위반할 수 있음을 보이며, 이를 보정하기 위해서는 추가적인 확산이 필수적으로 주입되어야 함을 증명합니다.

Ammar Fayad2026-03-09⚛️ quant-ph

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

이 논문은 사전 학습 단계에서 기존 선형 계층에 비선형 저랭크 분기를 영구적으로 추가하여 최소한의 오버헤드로 학습 효율성과 속도를 획기적으로 개선하는 새로운 아키텍처 'NOBLE'을 제안합니다.

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics

이 논문은 재학습 없이 소수의 예시만으로 대규모 언어 모델의 행동을 효과적으로 제어할 수 있도록, 인-컨텍스트 학습 동역학을 근사하는 새로운 프레임워크인 COLD-Steer 를 제안합니다.

Kartik Sharma, Rakshit S. Trivedi2026-03-09🤖 cs.AI

Semantics-Aware Caching for Concept Learning

이 논문은 설명 논리 기반 개념 학습에서 반복적인 인스턴스 검색으로 인한 런타임 병목 현상을 해결하기 위해, 의미론적 캐싱 기법을 도입하여 심볼릭 및 신경-심볼릭 추론기 모두에서 개념 학습 속도를 한 자릿수 이상 향상시켰음을 보여줍니다.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga Ngomo2026-03-09🤖 cs.LG

When One Modality Rules Them All: Backdoor Modality Collapse in Multimodal Diffusion Models

이 논문은 멀티모달 확산 모델에서 여러 모달리티를 동시에 공격하면 시너지 효과가 있을 것이라는 통념을 반박하며, 백도어 공격이 실제로는 특정 모달리티에 의존하는 '백도어 모달리티 붕괴' 현상이 발생하고 교차 모달리티 상호작용은 미미하거나 오히려 부정적임을 규명했습니다.

Qitong Wang, Haoran Dai, Haotian Zhang, Christopher Rasmussen, Binghui Wang2026-03-09🤖 cs.LG

Artificial Intelligence for Detecting Fetal Orofacial Clefts and Advancing Medical Education

이 논문은 22 개 병원 9,215 명의 태아 초음파 이미지 45,139 장으로 학습된 인공지능 시스템이 구순구개열의 산전 진단 정확도를 93% 이상의 민감도와 95% 이상의 특이도로 달성하여 숙련된 전문의 수준에 도달하고 초급 전문의의 진단 능력을 향상시키며, 희귀 질환에 대한 임상 교육까지 동시에 개선할 수 있음을 보여줍니다.

Yuanji Zhang, Yuhao Huang, Haoran Dou, Xiliang Zhu, Chen Ling, Zhong Yang, Lianying Liang, Jiuping Li, Siying Liang, Rui Li, Yan Cao, Yuhan Zhang, Jiewei Lai, Yongsong Zhou, Hongyu Zheng, Xinru Gao, Cheng Yu, Liling Shi, Mengqin Yuan, Honglong Li, Xiaoqiong Huang, Chaoyu Chen, Jialin Zhang, Wenxiong Pan, Alejandro F. Frangi, Guangzhi He, Xin Yang, Yi Xiong, Linliang Yin, Xuedong Deng, Dong Ni2026-03-09🤖 cs.AI

Predicting Atomistic Transitions with Transformers

이 논문은 트랜스포머 모델을 활용하여 나노 클러스터의 원자적 전이 경로를 기존 시뮬레이션보다 훨씬 낮은 계산 비용으로 예측하고, 물리적 타당성을 검증하며 다양한 미세 상태를 생성하는 방법을 제시합니다.

Henry Tischler, Wenting Li, Qi Tang, Danny Perez, Thomas Vogel2026-03-09🔬 cond-mat.mtrl-sci

Hierarchical Industrial Demand Forecasting with Temporal and Uncertainty Explanations

이 논문은 화학 산업의 복잡한 계층적 수요 예측 모델에 대해 시계열 데이터와 외부 변수의 중요성, 예측 불확실성, 그리고 학습 데이터 변경에 따른 영향 등을 설명할 수 있는 새로운 해석 가능성 방법을 제안하고, 이를 통해 실제 산업 환경에서의 의사결정 신뢰도와 활용도를 높이는 것을 목표로 합니다.

Harshavardhan Kamarthi, Shangqing Xu, Xinjie Tong, Xingyu Zhou, James Peters, Joseph Czyzyk, B. Aditya Prakash2026-03-09🤖 cs.LG

Causal Interpretation of Neural Network Computations with Contribution Decomposition

이 논문은 희소 오토인코더를 활용하여 신경망의 입력-출력 변환 과정을 숨겨진 뉴런의 인과적 기여도로 분해하는 CODEC 방법론을 제안하며, 이를 통해 기존 활성화 분석으로는 파악하기 어려운 계층적 비선형 계산의 메커니즘과 제어 가능성을 규명했습니다.

Joshua Brendan Melander, Zaki Alaoui, Shenghua Liu, Surya Ganguli, Stephen A. Baccus2026-03-09🤖 cs.LG

Boosting deep Reinforcement Learning using pretraining with Logical Options

이 논문은 심층 강화학습 에이전트의 단기 보상 과적착 문제를 해결하기 위해 심층 정책의 표현력을 유지하면서 기호적 구조를 주입하는 '하이브리드 계층적 강화학습 (H²RL)'이라는 새로운 두 단계 프레임워크를 제안하고, 이를 통해 장기적 의사결정 능력을 크게 향상시킨다는 점을 보여줍니다.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

이 논문은 대규모 데이터와 모델 스케일링 하에서 물리 기반 편향을 대체하여 장거리 상호작용을 정확하게 포착하고 실험 관측치를 재현하는 새로운 어텐션 기반 기계학습 원자 간 힘 모델인 AllScAIP 를 제안합니다.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

SCOPE 는 기존 3D 세그멘테이션 방법의 플러그 앤 플레이 백그라운드 기반 프로토타입 보강 프레임워크로, 새로운 클래스가 등장할 때 백그라운드 영역의 유사한 프로토타입을 활용하여 소량의 주석 데이터만으로도 catastrophic forgetting 을 줄이고 분산된 3D 세그멘테이션 성능을 크게 향상시킵니다.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

이 논문은 자율주행의 복잡한 의사결정 및 안전성 향상을 위해 대규모 언어 모델 (LLM) 의 추론 능력을 공간적으로 일관된 비조 (Bird's-Eye View) 표현으로 증류하는 BEVLM 프레임워크를 제안하며, 이를 통해 교차 뷰 추론 정확도를 46% 그리고 안전 위기 상황에서의 종단간 주행 성능을 29% 각각 개선함을 보여줍니다.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

Linear Multidimensional Regression with Interactive Fixed-Effects

이 논문은 3 차원 이상의 다차원 패널 데이터에 대한 선형 회귀 모형을 연구하여, Bai(2009) 의 요인 모형 추정과 가중치 내변환을 결합한 Neyman-orthogonal 추정법을 제시하고, 이를 통해 일관성과 모수적 수렴 속도를 확보하며 맥주 수요 탄력성을 추정하는 방법을 제안합니다.

Hugo Freeman2026-03-06💻 cs

Zeroth-Order primal-dual Alternating Projection Gradient Algorithms for Nonconvex Minimax Problems with Coupled linear Constraints

이 논문은 결합된 선형 제약 조건이 있는 비볼록-강한 오목 및 비볼록-오목 미니맥스 문제를 해결하기 위해 두 가지 제로차 순환 알고리즘 (ZO-PDAPG 및 ZO-RMPDPG) 을 제안하고, 결정론적 및 확률적 환경에서의 반복 복잡도 보장을 통해 기존 제로차 알고리즘보다 우수한 성능을 입증합니다.

Huiling Zhang, Zi Xu, Yuhong Dai2026-03-06🔢 math

← 이전 다음 →

cs.LG