cs.LG 편의 논문 | Gist.Science

A Dynamic Self-Evolving Extraction System

이 논문은 추출된 정보를 지식 베이스에 축적하고, 이를 다시 LLM 추출기의 성능 향상에 활용하는 폐쇄형 순환 구조를 통해 도메인 지식을 지속적으로 진화시키는 'DySECT'라는 동적 자기 진화 추출 시스템을 제안합니다.

Moin Amin-Naseri, Hannah Kim, Estevam Hruschka2026-03-10🤖 cs.LG

CN-CBF: Composite Neural Control Barrier Function for Safe Robot Navigation in Dynamic Environments

이 논문은 동적 환경에서 로봇의 안전한 항법을 위해 단일 장애물에 대한 최적 안전 집합을 근사하는 여러 신경 제어 장벽 함수 (CBF) 를 결합한 'CN-CBF' 방법을 제안하고, 이를 시뮬레이션 및 하드웨어 실험을 통해 기존 기법 대비 성공률을 최대 18% 향상시키면서 과도한 보수성을 유지하지 않음을 입증했습니다.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

NerVE: Nonlinear Eigenspectrum Dynamics in LLM Feed-Forward Networks

이 논문은 대규모 언어 모델의 피드포워드 네트워크에서 정보 흐름과 차원 활용을 이해하기 위해 스펙트럼 엔트로피, 참여 비율 등 4 가지 지표를 활용한 통합 고유스펙트럼 분석 프레임워크인 'NerVE'를 제안하며, 이를 통해 다양한 아키텍처와 옵티마이저 설정에서 모델의 일반화 성능과 설계 선택 간의 관계를 규명합니다.

Nandan Kumar Jha, Brandon Reagen2026-03-10🤖 cs.LG

Swimba: Switch Mamba Model Scales State Space Models

이 논문은 상태 공간 모델 (SSM) 의 재귀적 상태 업데이트 비용을 증가시키지 않으면서 전문가의 전문성을 도입하여 모델 용량을 확장하는 '스위치 맘바 (Swimba)'라는 새로운 아키텍처를 제안하고, 매개변수 공간에서 전문가를 혼합하는 방식이 계산 효율성을 유지하면서 성능을 향상시킬 수 있음을 이론적 및 실증적으로 입증합니다.

Zhixu Du, Krishna Teja Chitty-Venkata, Murali Emani, Venkatram Vishwanath, Hai Helen Li, Yiran Chen2026-03-10🤖 cs.LG

Physics-Consistent Neural Networks for Learning Deformation and Director Fields in Microstructured Media with Loss-Based Validation Criteria

이 논문은 코시라트 탄성 이론을 기반으로 한 변형 및 지향장 학습을 위해 물리 법칙을 준수하는 신경망 해법을 개발하고, 준볼록성 및 레전드르 - 하담 불등식과 같은 안정성 조건을 검증 기준으로 활용하여 물리적으로 타당한 평형 해를 보장하는 프레임워크를 제시합니다.

Milad Shirani, Pete H. Gueldner, Murat Khidoyatov, Jeremy L. Warren, Federica Ninno2026-03-10🤖 cs.LG

Joint MDPs and Reinforcement Learning in Coupled-Dynamics Environments

이 논문은 여러 행동에 대한 반사실적 결과의 결합 분포를 명시적으로 모델링하는 '결합 MDP(JMDP)'를 제안하고, 이를 통해 1 단계 결합 체제에서 n 차 반환 모멘트에 대한 벨만 연산자를 유도하여 수렴 보장이 있는 동적 프로그래밍 및 점진적 알고리즘을 제시합니다.

Ege C. Kaya, Mahsa Ghasemi, Abolfazl Hashemi2026-03-10🤖 cs.LG

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

이 논문은 DNA 기반 모델의 임베딩이 '임베딩-as-a-서비스 (EaaS)' 환경에서 공유될 때, 모델 역전 공격을 통해 민감한 원시 서열이 거의 완벽하게 복원될 수 있음을 보여주며, 특히 Evo 2 와 NTv2 모델이 취약하고 BPE 토큰화를 사용하는 DNABERT-2 가 상대적으로 더 안전함을 규명했습니다.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

이 논문은 대규모 그래프에서 GNN 파이프라인의 병목 현상을 해결하기 위해 그래프 희석 (sparsification) 이 정확도 유지 또는 향상을 보장하면서 학습 및 추론 속도를 획기적으로 개선할 수 있음을 체계적인 실험을 통해 입증합니다.

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki Kalavri2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

이 논문은 정책 경사 (PG) 기반 후학습이 베이스 모델의 지원 (support) 내에서는 최적의 효율성을 보이지만, 이를 벗어날 때는 차원의 저주에 직면한다는 한계를 규명하고, 이를 극복하기 위해 토큰 수준의 가능도 분위수 (LQ) 에 의존하는 과정 보상 모델을 제안합니다.

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards

이 논문은 수학적으로 검증 가능한 보상을 활용한 강화학습 기법인 Chart-RL 을 제안하여, 기존 지도학습보다 다양한 차트 이해 벤치마크에서 우수한 성능과 일반화 능력을 입증했습니다.

Xin Zhang, Xingyu Li, Rongguang Wang, Ruizhong Miao, Zheng Wang, Dan Roth, Chenyang Li2026-03-10🤖 cs.LG

Learning Quadruped Walking from Seconds of Demonstration

이 논문은 사족 보행의 한계 주기 및 포인카레 반환 맵 구조에 기반한 원리 분석을 통해, 시뮬레이션 없이 오프라인으로 단 몇 초의 시연 데이터만으로도 견고한 보행 정책을 학습할 수 있는 새로운 모방 학습 방법을 제안하고 하드웨어 실험을 통해 그 유효성을 입증합니다.

Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao2026-03-10🤖 cs.LG

A SISA-based Machine Unlearning Framework for Power Transformer Inter-Turn Short-Circuit Fault Localization

이 논문은 센서 고장으로 인한 데이터 중독 문제를 해결하기 위해 SISA 아키텍처를 기반으로 한 머신 언러닝 프레임워크를 제안하여, 변압기 권선 간 단락 고장 국소화 시 전체 모델 재학습 없이 손상된 데이터 조각만 재학습함으로써 재학습 시간을 획기적으로 단축하면서도 재학습과 동등한 진단 정확도를 달성함을 보여줍니다.

Nanhong Liu, Jingyi Yan, Mucun Sun, Jie Zhang2026-03-10🤖 cs.LG

Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks

이 논문은 지속성 호몰로지를 활용한 위상 인식 강화학습 프레임워크를 제안하여 극한 기상 및 사이버 공격 상황에서의 전력 배전망 재구성 및 부하 차단 최적화를 통해 에너지 공급량 증대와 전압 위반 감소를 달성하고 회복탄력성을 강화함을 보여줍니다.

Roshni Anna Jacob, Prithvi Poddar, Jaidev Goel, Souma Chowdhury, Yulia R. Gel, Jie Zhang2026-03-10🤖 cs.LG

Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling

이 논문은 조건부 생성 모델링에서 이상치에 민감한 기존 조건부 최적 수송 (COT) 의 한계를 해결하기 위해 조건부 마진을 엄격히 유지하면서 조건부 분포 매칭 제약을 완화하는 '조건부 불균형 최적 수송 (CUOT)' 프레임워크와 이를 기반으로 한 이상치 강건한 생성 모델 (CUOTM) 을 제안합니다.

Jiwoo Yoon, Kyumin Choi, Jaewoong Choi2026-03-10🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

이 논문은 일반합 게임 환경에서 근사 나시 균형을 계산하기 위해 플레이어 독립적인 잠재 함수를 학습하여 협력적 게임의 균형을 원본 게임의 균형으로 근사시키는 새로운 MARL 파이프라인인 NePPO(Near-Potential Policy Optimization) 를 제안하고, 이를 통해 기존 기법들보다 우수한 성능을 입증합니다.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay Maheshwari2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

이 논문은 역확산 샘플링을 선형 가용 마르코프 의사결정 과정 (LS-MDP) 의 상태 기반 확률적 제어 문제로 재해석하는 'DiffCon' 프레임워크를 제안하여, f-발산 정규화를 통한 강화학습 미세조정과 프리트레인된 백본을 고정하는 경량 사이드 네트워크 파라미터화를 통해 생성 품질과 효율성을 동시에 향상시킵니다.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

이 논문은 평균 치료 효과 (ATE) 가 0 인 상태에서도 최적화 과정에서 숨겨진 인과적 편향이 발생할 수 있음을 '인과적 가림' 문제로 규명하고, 이를 탐지하기 어렵기 때문에 공정성 규제를 개별 결정이 아닌 모델 수준에서 수행해야 함을 주장합니다.

Zou Yang, Sophia Xiao, Bijan Mazaheri2026-03-10🤖 cs.LG

Adaptive Discovery of Interpretable Audio Attributes with Multimodal LLMs for Low-Resource Classification

이 논문은 저자원 오디오 분류를 위해 멀티모달 대규모 언어 모델을 활용하여 인간 의존도를 줄이고 속도를 높인 해석 가능한 오디오 속성을 적응적으로 발견하는 방법을 제안하며, 기존 인간 중심 방식보다 효율적이고 정확한 분류 성능을 입증합니다.

Kosuke Yoshimura, Hisashi Kashima2026-03-10🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

이 논문은 매칭 플랫폼에서 참여자 만족도를 극대화하기 위해 제안된 '결합 할당 밴딧 (CAB)' 문제를 정의하고, 이를 해결하기 위한 상한 신뢰구간 (UCB) 및 톰슨 샘플링 (TS) 알고리즘을 개발하여 이론적 성능을 증명하고 실험을 통해 검증했습니다.

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji Ito2026-03-10🤖 cs.LG

Can Safety Emerge from Weak Supervision? A Systematic Analysis of Small Language Models

이 논문은 자동화된 평가 모델을 활용한 약한 지도 학습 기반의 'Self-MOA' 프레임워크를 제안하여, 소규모 언어 모델을 인간 감독 데이터에 의존하지 않고도 안전성과 유용성을 동시에 최적화할 수 있음을 입증했습니다.

Punyajoy Saha, Sudipta Halder, Debjyoti Mondal, Subhadarshi Panda2026-03-10🤖 cs.LG

← 이전 다음 →