cs.LG 편의 논문 | Gist.Science

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

이 논문은 확률적 목적 함수와 결정론적 비선형 제약 조건을 가진 최적화 문제를 해결하기 위해, 적응적 정확도 조건을 만족하는 확률적 오라클과 내점법을 결합한 새로운 '신뢰영역 내점법 확률적 순차 2 차 프로그래밍(TR-IP-SSQP)' 알고리즘을 제안하고 그 수렴성과 실용성을 입증합니다.

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

이 논문은 사후 XAI 기법에서 추출된 프로토타입을 기반으로 학습 과정의 진행을 정량화하여 모델의 '왜 그 부분을 보았는가'에 대한 구조화된 설명을 제공하고, 이를 통해 모델의 예측 정확도를 향상시킬 수 있는 새로운 프레임워크인 I2X 를 제안합니다.

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

이 논문은 단계 불균형 클래스 증분 학습 환경에서 기존 방법의 한계를 극복하기 위해, 비대칭 부분공간 정렬과 방향성 게이트 메커니즘을 통해 단일 어댑터에 태스크 업데이트를 통합하면서도 추론 비용을 일정하게 유지하는 'One-A' 프레임워크를 제안합니다.

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

이 논문은 편미분 방정식을 해결하는 네이티브 스파이킹 뉴로모픽 알고리즘이 구조적 교란 (뉴런 제거 및 스파이크 손실) 에 대해 본질적으로 강인하며, 최대 32% 의 뉴런과 90% 의 스파이크가 손실되더라도 정확도 저하 없이 작동할 수 있음을 보여줍니다.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

이 논문은 확산 기반 강화학습에서 음수 샘플의 피드백을 활용하고 과도한 탐욕적 행동을 방지하기 위해 부호 측도 (signed measure) 를 도입하여 가중치 조정 방식을 일반화한 'SiMPO' 프레임워크를 제안하고, 이를 통해 다양한 보상 환경에서 우수한 성능을 달성함을 보여줍니다.

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

이 논문은 하이퍼파라미터를 통해 정의된 계층적 베이지안 모델에서 조건부 사전분포가 최대 엔트로피 분포일 때, 하이퍼파라미터를 적분하여 얻은 종속적인 주변 사전분포 역시 다른 제약 조건 하에서 최대 엔트로피 성질을 가진다는 것을 증명함으로써 계층적 모델 할당이 실제로 어떤 정보를 가정하는지에 대한 통찰을 제공합니다.

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

이 논문은 TabPFN 의 순차적 생성 과정에서 인과 구조를 통합하여 (DAG 기반 조건부 샘플링 및 CPDAG 전략) 인과적 관계를 왜곡하는 허위 상관관계를 방지하고, 생성된 합성 데이터의 구조적 정확성과 인과 효과 보존 능력을 향상시키는 방법을 제안합니다.

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

이 논문은 단일세포 기초 모델인 scGPT 의 내부 메커니즘을 해석하여 혈액 세포 발달 알고리즘을 추출하는 새로운 방법을 제시하고, 기존 모델보다 높은 성능과 효율성을 입증했습니다.

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

이 논문은 사전 학습된 생성 로봇 정책을 온라인 피드백을 통해 성공적인 행동을 증폭시키는 '분산 수축 강화 학습 (DICE-RL)' 프레임워크를 도입하여, 고차원 픽셀 입력으로부터 복잡한 장기 작업 기술을 안정적이고 효율적으로 마스터할 수 있음을 제시합니다.

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

이 논문은 그래프 신경망 (GNN) 을 활용하여 희소 행렬의 조건수를 기존 Hager-Higham 및 Lanczos 방법보다 훨씬 빠르게 추정하는 새로운 기법을 제안합니다.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

이 논문은 노이즈가 있는 사용자 피드백 환경에서 보상 해킹과 오프라인 제약 문제를 해결하며, RLHF 보다 강력하고 해석 가능한 단일 하이퍼파라미터로 추천 시스템의 성능을 극대화하는 지수 보상 가중 SFT 방법론의 이론적 근거와 실증적 우수성을 제시합니다.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

이 논문은 ADMM 알고리즘과 스코어 기반 생성 모델을 통합할 때 발생하는 매니폴드 불일치와 수렴성 문제를 해결하기 위해 AC-DC(자동 및 방향 보정) 제거기를 도입한 새로운 ADMM-PnP 프레임워크를 제안하고, 이를 통해 다양한 역문제에서 우수한 성능과 이론적 수렴 보장을 입증합니다.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

이 논문은 두 데이터셋 간의 선형 관계를 일반화 특이값 분해 (GSVD) 를 통해 분석하여, 각 샘플이 두 데이터셋 중 어느 쪽에 더 잘 설명되는지를 정량화하는 해석 가능한 '각도 점수'를 제안하고 이를 MNIST 데이터셋에서 검증합니다.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

이 논문은 잔류 신경망 (ResNet) 과 코퓰라 모델을 결합한 'Copula-ResLogit'이라는 새로운 딥러닝 프레임워크를 제안하여, 교통 수요 분석에서 관측되지 않은 교란 요인으로 인한 비인과적 종속성을 탐지하고 완화하는 방법을 제시합니다.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

이 논문은 LLM-as-a-Judge 평가에서 발생하는 계산 비용과 편향을 해결하고 점수 구조를 분석하기 위해 질문, 답변자, 평가자의 조합으로 구성된 점수 텐서에 대해 군집 멤버십과 대표 객체 (medoids) 를 동시에 추정하는 새로운 텐서 군집화 방법인 MultiwayPAM 을 제안합니다.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

이 논문은 경쟁적 강화학습 환경에서 양자 얽힘을 활용하는 양자 - 고전 하이브리드 에이전트가 분리 가능한 회로나 기존 고전 신경망보다 우수한 성능을 보이며, 얽힘이 경쟁적 상호작용을 모델링하는 데 필수적인 표현 학습 자원임을 입증했습니다.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

이 논문은 인간 기억의 구조와 진화 특성을 모방하여 이산적 심볼 노드와 연속적 임베딩을 결합한 그래프 기반 하이브리드 자기 진화 구조 메모리 (HyMEM) 를 제안함으로써, 오픈 소스 GUI 에이전트가 폐쇄형 최첨단 모델을 능가하는 성능을 달성하도록 돕습니다.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

본 논문은 텍스트 속성 그래프 (TAG) 에서 노드 분류 성능을 극대화하면서도 전체 LLM 파인튜닝 대비 0.24% 의 파라미터만으로 구조적 정보를 통합하는 GaLoRA 라는 파라미터 효율적 프레임워크를 제안합니다.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

이 논문은 파라미터 미세조정 없이 사전 훈련된 대규모 언어 모델 (LLM) 을 활용하여 시장 레짐에 따라 컨텍스트를 학습하고 조정함으로써 비정상적인 시장 조건 하에서 기존 방법보다 우수한 금융 변동성 예측 성능을 달성하는 레짐 인식 인-컨텍스트 학습 프레임워크를 제안합니다.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

이 논문은 학습률 스케줄의 최적 형태를 찾기 위한 탐색 절차를 제안하여, 웜업과 감쇠가 필수적이며 기존에 널리 쓰이는 스케줄들은 최적이지 않으며 가중치 감소가 최적 형태에 큰 영향을 미친다는 것을 다양한 작업에서 입증했습니다.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

← 이전 다음 →