cs.LG 편의 논문 | Gist.Science

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

이 논문은 소매 판매 예측을 위해 다양한 머신러닝 모델을 비교 분석한 결과, 복잡한 딥러닝 아키텍처보다 XGBoost 와 같은 트리 기반 앙상블 모델이 결측치와 간헐적 수요가 있는 실제 환경에서 더 우수한 성능을 보였음을 시사합니다.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

이 논문은 강화학습 (RL) 의 한계를 보완하고 새로운 지식 습득을 가능하게 하기 위해 RL 과 온라인 파인튜닝을 교차적으로 수행하는 'ReLIFT'라는 새로운 훈련 방식을 제안하며, 이를 통해 기존 모델의 능력을 넘어선 추론 성능 향상과 데이터 효율성을 입증했습니다.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

이 논문은 병렬 학습과 순차 추론을 동시에 지원하는 '접두어 스캔 가능 모델 (Prefix-Scannable Models)'이라는 새로운 범주를 정의하여 기존 아키텍처를 통합하고, 새로운 연산자를 통해 효율성과 표현력을 동시에 달성하는 모델을 제안합니다.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

이 논문은 미분 프라이버시의 기본 정의와 이론적·실무적 진화를 개괄하고, 머신러닝 모델 학습 시 프라이버시를 보호하는 방법론과 평가 기법을 심층적으로 분석하여 안전하고 책임 있는 AI 시스템 개발에 기여하는 포괄적인 조사를 제공합니다.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

이 논문은 실루엣 점수를 기반으로 데이터 포인트에 가중치를 부여하고 적응형 온도를 통해 경계점과 노이즈를 억제하여 $k$ -means 알고리즘의 클러스터링 성능을 향상시킨 K-Sil 알고리즘을 제안하고 그 유효성을 입증합니다.

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

이 논문은 기존 한아비 (Hanabi) 환경의 한계를 극복하고 제로샷 조율 (ZSC) 연구의 새로운 표준이 될 수 있도록, 불확실한 힌트와 이동하는 카드를 추적하며 공유된 신념을 구축해야 하는 새로운 다중 에이전트 강화학습 벤치마크인 '요카이 학습 환경 (YLE)'을 제안하고 기존 최첨단 방법론들의 한계를 입증합니다.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

이 논문은 가우시안 보상을 가정하는 확률적 밴딧 환경에서 샤프 비율을 최적화하기 위한 톰슨 샘플링 알고리즘 (SRTS) 을 제안하고, 새로운 레그렛 분해 기법을 통해 로그 레그렛 상한과 하한을 유도하여 알고리즘의 차수 최적성을 증명합니다.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

이 논문은 전역 제어 필드를 가진 아날로그 양자 시뮬레이터가 보편적 양자 연산이 가능함을 이론적으로 증명하고, '직접 양자 최적 제어' 기법을 통해 실제 실험에서 3 체 상호작용 및 위상 동역학을 구현하여 양자 정보 처리의 새로운 가능성을 제시합니다.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

이 논문은 특정 모드 방향으로의 섬유 (fiber) 단위가 완전히 관측되거나 결측된 텐트 데이터에 대해, 확률적 가정이 아닌 결정론적 조건 하에서 표준 선형대수 연산만으로 텐서 트레인 분해를 수행하여 빠르고 효율적으로 텐서를 복원하는 새로운 방법을 제안합니다.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

이 논문은 목적 함수가 변하는 매개변수 최적 제어 문제를 위해 오프라인에서 학습된 신경 기저 함수 집합을 활용하여, 온라인에서 데이터 투영이나 문제 명세 직접 매핑을 통해 재계산 없이도 실시간으로 최적에 가까운 제어를 수행할 수 있는 제로샷 전이 가능 솔루션 방법을 제안합니다.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

이 논문은 시그모이드 손실 함수에 학습 가능한 역온도와 편향을 도입하여 $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -군집이라는 새로운 조합론적 구조를 통해 SigLIP 의 성공, 모달리티 간격 현상, 그리고 고품질 표현을 위한 필요 차원을 이론적으로 설명하고, 이를 기반으로 한 손실 함수의 재파라미터화를 제안합니다.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

이 논문은 메탄 위성 및 항공 이미징 분광학에서 메탄 농도 추정의 정확도를 높이기 위해 U-Net 및 SCAN 과 같은 딥러닝 모델이 기존 방법보다 구름과 구름 그림자 분할 성능을 크게 향상시킨다는 것을 입증합니다.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

이 논문은 23 개의 시각 질문 응답 벤치마크에 대한 대규모 실증 연구를 통해 현재 멀티모달 평가가 모달리티 간 상호작용보다 개별 모달리티 의존성에 과도하게 의존하고 있음을 규명하고, 이를 바탕으로 보다 원칙적인 벤치마크 설계 방향을 제시합니다.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

Proposing a Framework for Machine Learning Adoption on Legacy Systems

이 논문은 레거시 시스템의 업그레이드 비용과 운영 중단 문제를 해결하기 위해 ML 모델 수명 주기와 생산 환경을 전략적으로 분리하는 경량 API 기반 프레임워크를 제안하여, 인간 개입을 통한 상호작용적 제어와 무중단 유지보수를 가능하게 함으로써 제조업의 경쟁력을 강화하는 방안을 제시합니다.

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

이 논문은 기존 프롬프트 기반 지속 학습 방법들의 효율성과 성능 간 트레이드오프를 해결하기 위해 희소 혼합 전문가 (MoE) 구조를 도입하여 프롬프트를 여러 '전문가'로 구성하고, 동적 선택 메커니즘과 적응형 노이즈 등을 통해 간섭을 줄이면서 파라미터와 계산 비용을 대폭 절감한 'SMoPE' 프레임워크를 제안합니다.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

이 논문은 다양한 추론 모델과 예산 간의 성능과 비용 트레이드오프를 해결하기 위해, 심리측정학에 영감을 받아 질문 난이도와 모델 능력을 학습하여 최적의 모델 - 예산 쌍으로 쿼리를 라우팅하는 경량화되고 해석 가능한 RADAR 프레임워크를 제안합니다.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

이 논문은 다양한 연산 원소의 조합을 체계적으로 탐색하여 Llama 3.2 보다 성능이 우수하고 효율적인 하이브리드 신경망 아키텍처를 자동 설계하는 프레임워크 'Composer'를 제안합니다.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

이 논문은 상호정보량 기반 확산 모델을 활용하여 고차 시각 피질의 뉴런 집단이 객체 자세 및 범주 간 변환 등 의미 있는 시각적 특징으로 구조화된 잠재 하위 공간에 선택적으로 인코딩되어 있음을 규명한 MIG-Vis 방법을 제안합니다.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

이 논문은 다중 에이전트 LLM 시스템에서 협력 유도 측면에서 직접적인 의사소통이 curriculum 기반 학습보다 훨씬 효과적이며, 오히려 특정 커리큘럼 설계는 에이전트의 협력 의지를 약화시킬 수 있음을 보여줍니다.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

이 논문은 웨어러블 EEG 를 활용한 수면 단계 분류에서 라벨 효율성을 극대화하기 위해 자기지도 학습 (SSL) 을 체계적으로 평가한 결과, SSL 이 라벨이 부족한 상황에서도 기존 지도 학습보다 최대 10% 높은 성능을 달성하고 임상 수준 정확도를 보여준다는 것을 입증했습니다.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

← 이전 다음 →

cs.LG