cs.LG 편의 논문 | Gist.Science

Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning

이 논문은 군 엔트로피와 군 이론적 미러 맵을 활용하여 머신러닝의 미러 강하 (Mirror Descent) 알고리즘을 무한히 유연한 가족으로 확장하고, '미러 쌍대성' 개념을 통해 학습률 제약을 만족하면서 데이터의 통계적 특성에 맞춰 최적화 업데이트를 적응적으로 조정하는 새로운 이론 및 알고리즘 프레임워크를 제안합니다.

Andrzej Cichocki, Piergiulio Tempesta2026-03-10🤖 cs.LG

Context-free Self-Conditioned GAN for Trajectory Forecasting

이 논문은 2D 궤적의 다양한 행동 모드를 학습하기 위해 컨텍스트가 없는 자기 조건부 GAN 기반의 비지도 접근법을 제안하며, 인간 운동 및 도로 에이전트 데이터셋에서 기존 방법보다 우수한 궤적 예측 성능을 입증합니다.

Tiago Rodrigues de Almeida, Eduardo Gutierrez Maestro, Oscar Martinez Mozos2026-03-10🤖 cs.LG

How Far Can Unsupervised RLVR Scale LLM Training?

이 논문은 검증 가능한 보상을 활용한 비지도 강화학습 (URLVR) 이 초기 모델의 분포를 강화하는 메커니즘을 통해 학습이 일시적으로 향상되다가 결국 붕괴된다는 이론적·실험적 한계를 규명하고, 이를 극복하기 위한 외부 보상 기반 접근법의 가능성을 제시합니다.

Bingxiang He, Yuxin Zuo, Zeyuan Liu, Shangziqi Zhao, Zixuan Fu, Junlin Yang, Cheng Qian, Kaiyan Zhang, Yuchen Fan, Ganqu Cui, Xiusi Chen, Youbang Sun, Xingtai Lv, Xuekai Zhu, Li Sheng, Ran Li, Huan-ang Gao, Yuchen Zhang, Bowen Zhou, Zhiyuan Liu, Ning Ding2026-03-10🤖 cs.LG

Characterization and upgrade of a quantum graph neural network for charged particle tracking

이 논문은 고광도 LHC 환경에서 하전 입자 궤적 재구성을 위해 고전 신경망과 양자 회로를 혼합한 하이브리드 양자 그래프 신경망 (QGNN) 아키텍처를 개선하고, 기존 설계 대비 향상된 학습 수렴 특성을 입증했습니다.

Matteo Argenton, Laura Cappelli, Concezio Bozzi2026-03-10⚛️ quant-ph

Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation

이 논문은 Nesterov 가속화를 매개변수 업데이트와 확률 분포 공간에 모두 도입하여 'Momentum SVGD-EM'이라는 새로운 알고리즘을 제안함으로써, 최대 주변 가능도 추정 (MMLE) 문제의 수렴 속도를 다양한 차원과 난이도에서 획기적으로 개선함을 보여줍니다.

Adam Rozzio, Rafael Athanasiades, O. Deniz Akyildiz2026-03-10🤖 cs.LG

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

이 논문은 AI 기반 진화 탐색 기법인 AlphaEvolve 를 활용하여 양자 거래에서 무작위 제안자 (RO) 메커니즘의 최적 효율성 대비 worst-case 성능 하한을 기존 2.02 에서 2.0749 로 개선한 새로운 사례를 발견했다고 요약할 수 있습니다.

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Structural Causal Bottleneck Models

이 논문은 고차원 변수 간의 인과 효과가 저차원 요약 통계량인 '병목'에 의존한다는 가정을 바탕으로, 기존 인과 표현 학습이나 추상화 학습의 대안이 될 수 있는 새로운 구조적 인과 모델인 '구조적 인과 병목 모델 (SCBMs)'을 제안하고 그 식별성, 정보 병목 이론과의 연관성, 그리고 실험적 추정 방법과 저샘플 전이 학습에서의 효과를 분석합니다.

Simon Bing, Jonas Wahl, Jakob Runge2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

이 논문은 고비트 심도 (24 비트) 오디오의 손실 압축을 위해 어휘 크기를 상수 수준으로 줄이는 'Trilobyte' 바이트 단위 토큰화 방식을 제안하여, 기존 코덱을 능가하는 언어 모델 기반의 실용적 오디오 압축을 가능하게 했음을 보여줍니다.

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

이 논문은 분할 연합 학습 (SFL) 의 모델 분할 계층과 클라이언트 - 집계기 할당이 정확도, 지연 시간, 오버헤드에 미치는 영향을 고려하여 NP-난해한 최적화 문제를 해결하는 새로운 휴리스틱 알고리즘을 제안함으로써, 기존 방식 대비 정확도를 3% 향상시키고 지연 시간을 20% 단축하며 오버헤드를 50% 감소시킨다고 주장합니다.

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

이 논문은 모방 학습의 한계를 극복하고 에이전트가 행동의 질에 대한 자율적 추론 능력을 기르도록 하는 새로운 강화 학습 패러다임인 '에이전틱 크리티컬 트레이닝 (ACT)'을 제안하며, 이를 통해 다양한 벤치마크에서 모방 학습 및 기존 강화 학습 대비 성능을 크게 향상시키고 일반화 능력을 입증했습니다.

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting

이 논문은 정적 데이터 분할의 한계를 극복하고 지속 가능한 성능 평가를 위해 GitHub 활동 데이터를 기반으로 실시간으로 업데이트되는 새로운 시간 계열 예측 벤치마크 'Impermanent'를 제안합니다.

Azul Garza, Renée Rosillo, Rodrigo Mendoza-Smith, David Salinas, Andrew Robert Williams, Arjun Ashok, Mononito Goswami, José Martín Juárez2026-03-10🤖 cs.LG

A mixed-frequency approach for exchange rates predictions

이 논문은 시계열 집계로 인한 정보 부족 문제를 해결하기 위해 혼합 주파수 모델을 제안하고, CAD/USD 환율 예측을 통해 기존 방법 대비 그 유효성을 입증합니다.

Raffaele Mattera, Michelangelo Misuraca, Germana Scepi, Maria Spano2026-03-09🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

이 논문은 의료 전문가의 인지 관점에서 해석 가능한 fetal 초음파 이미지 분류를 위해 핵심 의료 개념과 개념 기반 그래프 합성곱 신경망 (GCN) 을 활용한 프레임워크를 제안합니다.

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Correlations Between COVID-19 and Dengue

이 논문은 신경망과 LSTM 모델을 활용하여 기후 및 사회적 변수를 고려한 COVID-19 와 뎅기열 간의 상관관계를 규명하고, COVID-19 데이터를 기반으로 뎅기열 데이터가 부족한 국가의 감염 추정을 가능하게 하는 예측 모델을 제시합니다.

Paula Bergero, Laura P. Schaposnik, Grace Wang2026-03-09🧬 q-bio

Graph Neural Networks on Factor Graphs for Robust, Fast, and Scalable Linear State Estimation with PMUs

이 논문은 PMU 측정을 기반으로 한 전력 시스템 상태 추정을 위해 요인 그래프 상의 그래프 신경망 (GNN) 을 도입하여, 높은 정확도와 확장성을 유지하면서도 센서 고장이나 통신 장애와 같은 국부적 오류가 전체 시스템에 미치는 영향을 최소화하는 견고하고 효율적인 선형 상태 추정 알고리즘을 제안합니다.

Ognjen Kundacina, Mirsad Cosovic, Dragisa Miskovic + 1 more2026-03-09⚡ eess

Expert-Aided Causal Discovery of Ancestral Graphs

이 논문은 잠재 교란 변수가 있는 인과 시스템을 표현하는 조상 그래프 (Ancestral Graphs) 에 대한 분포 추론과 사전·사후 전문가 지식을 통합하여, 불확실한 피드백을 기반으로 최적의 인과 구조를 학습하는 강화 학습 기반 알고리즘 'Ancestral GFlowNet (AGFN)'을 제안하고 그 유효성을 입증합니다.

Tiago da Silva, Bruna Bazaluk, Eliezer de Souza da Silva, António Góis, Salem Lahlou, Dominik Heider, Samuel Kaski, Diego Mesquita, Adèle Helena Ribeiro2026-03-09🤖 cs.LG

A unified framework for learning with nonlinear model classes from arbitrary linear samples

이 논문은 임의의 선형 샘플로부터 비선형 모델 클래스를 학습하는 문제를 해결하기 위해, 모델 클래스의 구조적 특성과 측정 과정 간의 상호작용을 정량화하는 새로운 통합 프레임워크를 제시하고 이를 통해 기존 결과들을 일반화하며 최적에 가까운 일반화 보장을 확립합니다.

Ben Adcock, Juan M. Cardenas, Nick Dexter2026-03-09🤖 cs.LG

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

이 논문은 물리적 메모리의 에너지 장벽을 조절하여 최적화 및 어닐링 역학과 일치시키는 이상적인 뉴로모픽 학습 인 메모리 (LIM) 옵티마이저의 에너지 소산 하한을 유도하고, 이를 대규모 AI 워크로드에 적용하여 모델-중립적인 에너지 효율성 추정치를 제시합니다.

Zihao Chen, Faiek Ahsan, Johannes Leugering, Gert Cauwenberghs, Shantanu Chakrabartty2026-03-09🤖 cs.AI

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

이 논문은 포즈 정보를 활용한 컨텍스트 학습 (PA-ICVL) 을 통해 비현실적 렌더링 (NPR) 영역의 시각적 환각을 기존 RGB 기반 방법보다 훨씬 정확하게 탐지하는 새로운 비전 - 언어 모델 (VLM) 시스템을 제안하고 그 유효성을 입증합니다.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

이 논문은 단백질 표적 정보를 기반으로 분자와 상호작용을 동시에 생성하여 구조 기반 약물 설계의 여러 목표를 균형 있게 달성하는 새로운 확산 모델 'BInD'를 제안하고, 이를 통해 표적 결합력 및 특이성을 향상시키는 최적화 방법을 제시합니다.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

← 이전 다음 →