cs.LG 편의 논문 | Gist.Science

XConv: Low-memory stochastic backpropagation for convolutional layers

이 논문은 기존 코드베이스에 추가 수정 없이 통합 가능하며, 아키텍처 제약을 두지 않으면서도 역전파 시 중간 활성화 메모리 사용을 2 배 이상 절감하고 확률적 경사 하강법과 유사한 수렴성을 보장하는 새로운 합성곱 레이어인 XConv 를 제안합니다.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. HerrmannWed, 11 Ma🤖 cs.LG

A Survey on Decentralized Federated Learning

이 논문은 2018 년부터 2026 년 초까지의 탈중앙화 연방학습 (DFL) 연구들을 체계적으로 검토하고, 기존 중앙집중식 FL 의 한계를 극복하는 두 가지 아키텍처를 분류하며, 핵심 병목 현상에 기반한 통합 분류 체계를 제시하고 향후 연구 방향을 제안합니다.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele TolomeiWed, 11 Ma🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

이 논문은 다차원 랜덤 부분합 문제의 최근 발전을 활용하여 구조적 가지치기 (structured pruning) 를 위한 강한 로또 티켓 가설을 수학적으로 증명하고, 무작위 초기화된 합성곱 신경망이 훈련 없이도 효율적인 구조적 서브네트워크를 포함함을 보여줍니다.

Arthur da Cunha, Francesco d'Amore, Emanuele NataleWed, 11 Ma🤖 cs.LG

Provable Filter for Real-world Graph Clustering

이 논문은 실제 그래프의 동질성과 이질성을 동시에 고려하여 이론적으로 증명된 필터링 기법을 제안하고, 이를 통해 기존 최첨단 방법들보다 우수한 그래프 클러스터링 성능을 입증합니다.

Xuanting Xie, Erlin Pan, Zhao Kang, Wenyu Chen, Bingheng LiWed, 11 Ma🤖 cs.LG

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

이 논문은 좌표와 흐름 맵의 결합적 발견을 통해 딥러닝 기반의 정밀 시간 단계 접근법을 제시함으로써, 다양한 시공간 스케일을 가진 다중 스케일 시스템의 시뮬레이션 비용을 줄이면서도 최첨단 예측 정확도를 달성하는 프레임워크를 제안합니다.

Asif Hamid, Danish Rafiq, Shahkar Ahmad Nahvi, Mohammad Abid BazazWed, 11 Ma🤖 cs.LG

Sparse Variational Student-t Processes for Heavy-tailed Modeling

이 논문은 대규모 데이터셋에서 이상치와 heavy-tail 분포를 효과적으로 모델링하기 위해 희소 유도점 방법을 Student-t 프로세스로 확장한 'Sparse Variational Student-t Processes(SVTP)' 프레임워크와 두 가지 새로운 추론 알고리즘을 제안하며, 이를 통해 기존 희소 가우시안 프로세스 대비 뛰어난 예측 정확도와 수렴 속도를 달성함을 보여줍니다.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

HYGENE: A Diffusion-based Hypergraph Generation Method

이 논문은 기존에 존재하지 않았던 딥러닝 기반의 초그래프 생성 방법론인 HYGENE 를 제안하며, 확산 모델을 활용해 이분 그래프 표현을 기반으로 국소적 확장을 통해 복잡하고 다양한 초그래프 구조를 효과적으로 생성하는 것을 목표로 합니다.

Dorian Gailhard, Enzo Tartaglione, Lirida Naviner, Jhony H. GiraldoWed, 11 Ma🤖 cs.LG

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

이 논문은 양자화와 희소화 연산에서 발생하는 불연속성 문제를 해결하기 위해 양자화를 첨가 노이즈로 모델링하고, 이를 보정하는 정교한 기울기 경로를 제공하는 통합 프레임워크를 제안하여 임의의 정밀도와 희소성 수준에서 안정적으로 신경망을 학습시키는 방법을 제시합니다.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

이 논문은 강화학습의 하이퍼파라미터 최적화 연구에 필요한 다양한 접근법 간의 비교와 저사양 환경에서의 평가를 가능하게 하기 위해 효율적이고 유연한 벤치마크인 'ARLBench'와 대규모 데이터셋을 제안합니다.

Jannis Becktepe, Julian Dierkes, Carolin Benjamins, Aditya Mohan, David Salinas, Raghu Rajan, Frank Hutter, Holger Hoos, Marius Lindauer, Theresa EimerWed, 11 Ma🤖 cs.LG

DRUPI: Dataset Reduction Using Privileged Information

이 논문은 기존 데이터 축소 기법에 특징 또는 주의 주석과 같은 '우월 정보(Privileged Information)'를 추가로 합성하여 모델 학습을 보조함으로써, ImageNet-1K 등 다양한 데이터셋에서 기존 방법들의 성능을 획기적으로 향상시킨 'DRUPI' 방법을 제안합니다.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

Unsupervised Representation Learning from Sparse Transformation Analysis

이 논문은 잠재 변수의 변환을 희소 성분으로 분해하여 시퀀스 데이터에서 비지도 학습을 수행함으로써, 독립적인 요인과 변환 원리를 모두 포착하는 새로운 형태의 분리된 표현을 학습하고 데이터 가능성과 근사 공변성 오류 측면에서 최첨단 성능을 달성함을 보여줍니다.

Yue Song, Thomas Anderson Keller, Yisong Yue, Pietro Perona, Max WellingWed, 11 Ma🤖 cs.LG

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

이 논문은 제어 장벽 함수와 미분 가능 최적화를 기반으로 한 데이터 중심 접근법을 통해 다중 에이전트 상호작용에서 안전성을 보장하기 위해 에이전트가 얼마나 자신의 행동을 조정하는지 (책임 할당) 를 학습하고 해석 가능한 정량적 통찰을 제공하는 방법을 제시합니다.

Isaac Remy, David Fridovich-Keil, Karen LeungWed, 11 Ma🤖 cs.LG

cs.LG

XConv: Low-memory stochastic backpropagation for convolutional layers

A Survey on Decentralized Federated Learning

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Provable Filter for Real-world Graph Clustering

Enhancing Computational Efficiency in Multiscale Systems Using Deep Learning of Coordinates and Flow Maps

Sparse Variational Student-t Processes for Heavy-tailed Modeling

HYGENE: A Diffusion-based Hypergraph Generation Method

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

ARLBench: Flexible and Efficient Benchmarking for Hyperparameter Optimization in Reinforcement Learning

DRUPI: Dataset Reduction Using Privileged Information

Unsupervised Representation Learning from Sparse Transformation Analysis

Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions

Calabi-Yau metrics through Grassmannian learning and Donaldson's algorithm

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Scalable Message Passing Neural Networks: No Need for Attention in Large Graph Representation Learning

SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG

Prognostics for Autonomous Deep-Space Habitat Health Management under Multiple Unknown Failure Modes

Morphological-Symmetry-Equivariant Heterogeneous Graph Neural Network for Robotic Dynamics Learning

CuriousBot: Interactive Mobile Exploration via Actionable 3D Relational Object Graph

Molecular Fingerprints Are Strong Models for Peptide Function Prediction