cs.LG 편의 논문 | Gist.Science

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

이 논문은 제한된 에지 자원과 불확실한 서비스 수요 하에서 지연을 최소화하는 최적의 서비스 배치를 찾기 위해, 소셀 네트워크의 기지국들이 협력하여 선형 밴딧 문제를 해결하는 분산형 적응적 최적-arm 식별 알고리즘을 제안하고 그 성능을 이론적·실험적으로 검증합니다.

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

이 논문은 그론월 부등식을 사용하여 볼록 및 비볼록 목적 함수 하에서 확률적 경사 하강법 (SGD) 과 확률적 헤비 볼 (SHB) 알고리즘의 마지막 반복에 대한 수렴 속도를 분석하고 새로운 수렴 오차 한계를 제시합니다.

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

본 논문은 지반공학의 압밀 문제에 DeepONet 아키텍처를 적용하여 물리 기반 모델 (Model 3) 과 푸리에 특징이 강화된 3D 모델 (Model 4) 의 성능을 비교 평가함으로써, 기존 수치 해석 대비 최대 1,000 배의 속도 향상과 불확실성 정량화 가속화를 가능하게 하는 과학적 머신러닝의 잠재력을 입증했습니다.

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

이 논문은 물리적 사전 지식 (관성, 감쇠, 학습된 퍼텐셜 등) 을 기반으로 한 언더댐프드 랑베인 방정식을 잠재 공간의 시간 진화에 적용하여, 생물학적 신경 집단의 진동 및 흐름 특성을 효과적으로 모델링하고 기존 최첨단 방법들보다 우수한 성능을 보이는 'LangevinFlow'라는 시퀀스 변분 오토인코더를 제안합니다.

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

이 논문은 다양한 신체 구조의 데이터를 광학 흐름을 통해 통합하여 세계 모델을 사전 학습한 후, 이를 타겟 로봇의 소량 데이터로 미세 조정하고 가치 함수를 활용해 행동 복제 정책을 최적화함으로써 저데이터 환경에서 로봇 시각-운동 정책의 성능을 획기적으로 향상시키는 '잠재 정책 조종 (LPS)' 방법을 제안합니다.

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

이 논문은 투명하고 검증 가능한 제어 정책 개발을 위해 멀티모달 대형 언어 모델과 진화적 탐색을 결합한 MLES 방식을 제안하며, 시각적 피드백을 통해 정책 생성을 자동화하고 PPO 와 유사한 성능을 달성함을 보여줍니다.

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

이 논문은 다양한 소스로부터의 데이터 분포 변화와 샘플 크기 편차를 해결하면서도 전체 정확도와 소스별 이질성을 동시에 보장하기 위해 교차 도메인 잔차 학습과 적응형 클러스터링을 결합한 메타학습 기법인 'CTRL'을 제안하고, 스위치 난민 프로그램 등 5 개 대규모 데이터셋을 통해 기존 벤치마크보다 우수한 성능을 입증합니다.

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

이 논문은 HeyGem 과 같은 오픈소스 도구를 활용해 텍스트 기반 강의 개요를 가상 아바타가 부르는 노래로 변환함으로써 학생들의 참여도와 정보 기억력을 향상시키는 새로운 교수법을 제안하고 그 효과를 입증했습니다.

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

본 논문은 단일 건물 모델의 한계를 극복하고 다양한 제어 시나리오에서 물리 기반의 정밀한 다중 건물 유연성 분석 및 조정을 가능하게 하는 확장 가능한 오픈소스 플랫폼 'MuFlex'를 제안하며, 이를 통해 강화학습 기반의 수요 반응 최적화 가능성을 입증했습니다.

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

이 논문은 RF 회로의 비선형적 특성과 높은 시뮬레이션 비용을 해결하기 위해 RFIC 도메인 지식을 그래프 신경망에 접목하여, 소량 데이터로도 다양한 토폴로지의 능동 RF 회로 성능을 기존 기술 대비 9.2 배 정밀하게 예측하는 경량화된 프레임워크를 제안합니다.

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

이 논문은 추상적 추론이 필요한 대수적 작업에서 일반화 능력을 향상시키기 위해, 테스트 데이터 분포보다 단순한 Few-shot 예제를 선택적으로 반복적으로 구성하는 새로운 인-컨텍스트 학습 전략을 제안하고 그 유효성을 입증합니다.

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

이 논문은 T-A 공식으로 생성된 유한요소법 데이터를 기반으로 학습된 잔류 신경망 (FCRN) 기반 대리 모델을 개발하여 고온 초전도 자석의 전류 분포를 신속하고 정확하게 예측함으로써 대규모 자석의 지능형 설계를 가능하게 했음을 보여줍니다.

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

이 논문은 구면 상의 함수 적분, 특히 슬라이스된 워터스테인 거리 계산을 위해 부정적 의존성을 가진 반발적 몬테카를로 방법 (DPP, 반발 점 과정 등) 과 UnifOrtho 추정기를 제안하고 벤치마크하여, 차원에 따라 무작위 준몬테카를로 또는 UnifOrtho 를 사용하는 것이 최적임을 규명합니다.

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

이 논문은 대규모 일반화 정책 기반의 로봇 학습 연구를 지원하기 위해 시뮬레이션과 실제 환경 간 전환을 원활하게 하는 경량화되고 모듈화된 로봇 제어 스택 (RCS) 을 제안하고, 그 아키텍처 설계 원리와 VLA 및 RL 정책 개발 과정에서의 유용성과 성능을 평가합니다.

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

이 논문은 생물학적 동기화 현상에서 영감을 받아 주기적 도메인에서 스토캐스틱 쿠라모토 동역학을 활용하여 지문 및 질감처럼 방향성이 풍부한 이미지의 생성 품질을 획기적으로 개선한 새로운 스코어 기반 생성 모델을 제안합니다.

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

이 논문은 LLM 코드 변이 에이전트인 AlphaEvolve 를 활용하여 MAX-CUT, MAX-4-CUT, MAX-3-CUT, 그리고 TSP 등 다양한 조합 최적화 문제의 근사 불가능성 하한을 개선하고, 생성된 구조물의 검증을 가속화하는 새로운 방법을 제시함으로써 인공지능이 복잡성 이론의 발전에 기여할 수 있음을 보여줍니다.

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

이 논문은 ConceptNet 과 WordNet 의 외부 지식 그래프를 통합하여 일반 비전 - 언어 모델의 한계를 극복하고, 재해 위성 및 UAV 이미지 설명의 정확성과 실용성을 획기적으로 향상시킨 'VLCE' 프레임워크를 제안하고 xBD 와 RescueNet 데이터셋에서 그 우수성을 입증합니다.

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

이 논문은 테스트 시간 엔트로피 최소화 과정에서 발생할 수 있는 모델 붕괴를 방지하고 학습 신호를 정규화하기 위해 비대칭 시아미즈 아키텍처인 ZeroSiam을 제안하여, 다양한 비전 및 언어 모델에서 안정적이고 효율적인 적응을 가능하게 합니다.

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

이 논문은 추가적인 학습 없이 기존 확산 또는 플로우 기반 로봇 정책들의 분포 점수를 결합하여 테스트 시간에 새로운 정책을 구성하는 '일반 정책 조합 (GPC)' 방법을 제안하고, 이를 통해 개별 정책보다 우수한 성능을 달성할 수 있음을 이론적 근거와 실험을 통해 입증합니다.

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

이 논문은 비선형 시변 시스템의 제어에서 심층 강화학습 (DRL) 의 성능을 극대화하고 시간 변화에 대한 강인성을 확보하기 위해, DRL 과 경계 극값 탐색 (ES) 을 결합한 하이브리드 제어기 개발과 그 유효성을 수치 시뮬레이션 및 로스 알라모스 중성자 과학 센터의 입자가속기 빔 수송 시스템 자동 튜닝 사례를 통해 입증했습니다.

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

← 이전 다음 →