cs.LG 편의 논문 | Gist.Science

SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning

이 논문은 다양한 데이터셋과 예측 구간에서 시간 계열 사전 학습 모델의 성능을 학습된 가이드와 경량 아키텍처를 통해 효율적으로 예측하여, 개별 미세 조정 없이 최적 모델을 신속하게 선택하는 'SwiftTS' 프레임워크를 제안합니다.

Tengxue Zhang, Biao Ouyang, Yang Shu, Xinyang Chen, Chenjuan Guo, Bin Yang2026-03-10🤖 cs.LG

Bayesian neural networks with interpretable priors from Mercer kernels

이 논문은 커널의 메르서 표현을 활용하여 신경망 매개변수에 직접 정의된 '메르서 사전분포'를 제안함으로써, 소규모 데이터에 국한된 가우시안 프로세스의 해석 가능성과 대규모 데이터에 적합한 베이지안 신경망의 확장성을 동시에 확보하는 새로운 프레임워크를 제시합니다.

Alex Alberts, Ilias Bilionis2026-03-10🤖 cs.LG

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

이 논문은 사용자와 아이템의 변화에 따른 추천 시스템의 지속적 학습 문제를 해결하기 위해, 최신 고정된 어댑터 상태를 기준점으로 하여 적응과 보존을 유연하게 조절하는 'PESO'라는 새로운 LoRA 기반 방법을 제안하고 그 우수성을 입증합니다.

Hyunsik Yoo, Ting-Wei Li, SeongKu Kang, Zhining Liu, Charlie Xu, Qilin Qi, Hanghang Tong2026-03-10🤖 cs.LG

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

이 논문은 BCI Competition IV-2a 데이터셋을 기반으로 해석 가능한 ANFIS-FBCSP-PSO 모델과 EEGNet 을 비교하여, 단일 사용자 환경에서는 전자가, 사용자 간 일반화 성능에서는 후자가 우세함을 입증함으로써 MI-BCI 시스템 설계 시 해석성과 강건성 중 어떤 목표를 우선시할지에 대한 실용적 지침을 제시합니다.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

이 논문은 모바일 엣지 컴퓨팅 환경에서 리소스 제약을 극복하기 위해 전문가 기반의 협업 추론과 개인화 및 일반화를 균형 있게 달성하는 연방 학습 프레임워크를 통합한 '네트워크형 혼합 전문가 (NMoE)' 시스템을 제안합니다.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

이 논문은 대학원 수준을 넘어선 추상 대수학 문제를 포함하는 새로운 벤치마크 'FATE'를 제안하고, 최신 대형 언어 모델들이 수학 경시대회 대비 연구 수준의 형식적 추론에서 극심한 성능 격차와 형식화 과정에서의 한계를 드러냈음을 보고합니다.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

이 논문은 인간 멘토의 논문을 기반으로 가설 수립, 실험, 논문 작성까지 수행하는 자율 AI 시스템 'Jr. AI Scientist'를 개발하고, 기존 자동화 시스템보다 높은 평가 점수를 얻은 성과를 입증하는 동시에 현재 시스템의 한계와 잠재적 위험을 종합적으로 분석하여 AI 과학 연구의 신뢰성과 지속 가능성을 위한 통찰을 제공합니다.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

Distributionally Robust Self Paced Curriculum Reinforcement Learning

이 논문은 고정된 강인성 예산의 한계를 극복하기 위해 강인성 예산을 학습 진행도에 따라 적응적으로 조절하는 '분포 강인 자기 주도 커리큘럼 강화학습 (DR-SPCRL)'을 제안하여, 훈련 안정성을 높이고 명목 성능과 강인성 간의 최적 균형을 달성함을 보여줍니다.

Anirudh Satheesh, Keenan Powell, Vaneet Aggarwal2026-03-10🤖 cs.LG

Adaptive Multi-view Graph Contrastive Learning via Fractional-order Neural Diffusion Networks

이 논문은 분수 차수 미분 순서를 학습 가능한 매개변수로 활용하여 수동 증강 없이 다양한 스케일의 그래프 뷰를 자동으로 생성하고, 이를 통해 기존 대비 더 강력하고 표현력 있는 임베딩을 학습하는 적응형 다중 뷰 그래프 대비 학습 프레임워크를 제안합니다.

Yanan Zhao, Feng Ji, Jingyang Dai, Jiaze Ma, Keyue Jiang, Kai Zhao, Wee Peng Tay2026-03-10🤖 cs.LG

Improving Conditional VAE with Non-Volume Preserving transformations

이 논문은 가변적 잠재 공간 분포를 추정하기 위해 비부피 보존 (NVP) 변환을 도입하여 기존 조건부 VAE 의 흐릿함과 다양성 부족 문제를 해결하고, FID 를 4% 감소시키고 로그 가능도를 7.6% 향상시킨 이미지 생성 방법을 제안합니다.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

이 논문은 $\ell_0$ 공격의 볼록 쉘을 정확히 계산하는 새로운 선형 경계 전파 기법을 제안하여 기존 $\ell_0$ 검증기의 성능을 3.16 배 (기하평균) 향상시켰습니다.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

이 논문은 쌍곡선 공간의 기하학적 특성을 활용하여 접선 공간의 기울기를 반경 방향과 각도 방향으로 분해하고, 의미적 민감도가 높은 각도 방향의 왜곡만을 적용하여 기존 방법보다 더 높은 공격 성공률을 달성하는 'Angular Gradient Sign' 방법을 제안합니다.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

이 논문은 실제 적용 가능성이 낮은 기존 'k-불안정' 가정을 넘어, 다양한 조크브레이킹 공격에 대한 더 현실적인 확률적 안전성 보장을 제공하는 '(k, $\varepsilon$ )-불안정' 프레임워크를 제안하여 SmoothLLM 방어 메커니즘의 신뢰성을 높입니다.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

이 논문은 심리학적 '발문법 (Foot-in-the-Door)' 기법을 자동화하여 대규모 멀티턴 LLM 재일브레이크 데이터셋을 구축하고, 이를 통해 GPT 계열 모델이 대화 맥락에 취약한 반면 Gemini 2.5 Flash 는 높은 방어력을 보임을 규명한 연구입니다.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

이 논문은 의료 영상 등 실제 환경에서shortcut-label 이나 shortcut-충돌 샘플 없이도, 해리된 잠재 공간에서 타겟된 아노트로픽 노이즈를 주입하여 분류기의 민감도를 정규화함으로써 OOD 일반화 성능을 획기적으로 개선하는 'Shortcut Invariance' 방법을 제안합니다.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

이 논문은 Kaggle 경진대회를 통해 다양한 머신러닝 아키텍처를 확보하고 이를 기후 모델에 통합한 결과, 저해상도 환경에서도 온라인 안정성을 재현할 수 있으며 일부 메트릭에서 최첨단 성능을 달성하여 하이브리드 물리-AI 기후 시뮬레이션의 발전 가능성을 입증했습니다.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG

SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning

Bayesian neural networks with interpretable priors from Mercer kernels

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Distributionally Robust Self Paced Curriculum Reinforcement Learning

Adaptive Multi-view Graph Contrastive Learning via Fractional-order Neural Diffusion Networks

Improving Conditional VAE with Non-Volume Preserving transformations

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

cs.LG

SwiftTS: A Swift Selection Framework for Time Series Pre-trained Models via Multi-task Meta-Learning

Bayesian neural networks with interpretable priors from Mercer kernels

Continual Low-Rank Adapters for LLM-based Generative Recommender Systems

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Distributionally Robust Self Paced Curriculum Reinforcement Learning

Adaptive Multi-view Graph Contrastive Learning via Fractional-order Neural Diffusion Networks

Improving Conditional VAE with Non-Volume Preserving transformations

Tight Robustness Certification Through the Convex Hull of ℓ0\ell_0ℓ0​ Attacks

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks