Learn to Bid as a Price-Maker Wind Power Producer
이 논문은 풍력 발전사가 시장 가격에 영향을 미치는 가격 결정자 (price-maker) 역할을 할 때, 복잡한 시장 모델 없이도 문맥적 다중 팔대역 (contextual multi-armed bandit) 알고리즘을 통해 최적 입찰 전략을 학습하여 불균형 비용을 최소화하는 온라인 학습 방법을 제안합니다.
4415 편의 논문
이 논문은 풍력 발전사가 시장 가격에 영향을 미치는 가격 결정자 (price-maker) 역할을 할 때, 복잡한 시장 모델 없이도 문맥적 다중 팔대역 (contextual multi-armed bandit) 알고리즘을 통해 최적 입찰 전략을 학습하여 불균형 비용을 최소화하는 온라인 학습 방법을 제안합니다.
이 논문은 유클리드 공간의 최대 마진 원리가 비유클리드 공간에서는 최적이지 않음을 지적하고, 클래스 공분산 구조의 초로레스키 분해를 활용하여 공분산 보정 SVM 분류기를 반복적으로 추정하는 알고리즘을 제안함으로써 비유클리드 공간에서의 분류 성능을 기존 SVM 보다 크게 향상시켰음을 보여줍니다.
이 논문은 과립 구체 (Granular Ball) 기반의 불완전 사전 지식을 도입하여 소량의 데이터로도 다양한 이미지 퓨전 작업에서 뛰어난 성능과 경량화를 달성하는 새로운 심층 퓨전 방법론을 제안합니다.
이 논문은 과거 수요에 의존하고 재고 부족으로 인해 판매 데이터가 검열 (censored) 되는 동적 재고 및 가격 결정 문제를 해결하기 위해, 검열된 의존적 수요 환경에서 최적 정책을 학습하는 새로운 데이터 기반 알고리즘을 제안하고 그 성능을 이론적 및 실험적으로 검증합니다.
이 논문은 비선형 제어 시스템의 상태 확률 밀도를 제어하기 위해, 잡음 확산 과정을 통해 상태 공간을 탐색한 후 이를 목표 분포로 되돌리는 결정론적 역과정 (Denoising) 을 기반으로 한 피드백 제어 및 계획 프레임워크를 제안하고, 이를 통해 비선형 제어 문제를 밀도 제어의 완화 문제로 간주하여 해결하는 방법을 제시합니다.
이 논문은 고정된 작업 전환 간격의 한계를 극복하고 간섭을 줄이며 확장 가능한 다중 작업 학습을 가능하게 하기 위해, 활성 수상돌기와 듀얼 구조를 갖춘 심층 스파이킹 Q-네트워크와 보상 및 내부 동역학을 기반으로 한 적응형 작업 전환 정책을 결합한 'SwitchMT' 방법론을 제안합니다.
이 논문은 진화 알고리즘으로 생성된 2 만 개의 카오스 동역학 시스템으로 학습된 사전 훈련 모델 'Panda'를 소개하며, 이 모델이 저차원 상미분방정식 훈련 데이터만으로도 고차원 편미분방정식 및 실제 실험 데이터에 대한 제로샷 예측 능력을 포함한 다양한 emergent 특성을 보인다고 설명합니다.
이 논문은 2022 년부터 2025 년 초까지의 25 만 건의 학술 논문을 분석하여 대규모 언어 모델 (LLM) 의 한계 연구 동향을 데이터 기반으로 체계적으로 조사하고, 추론과 일반화, 환각, 편향, 보안 등 주요 연구 주제의 변화와 성장 추세를 제시합니다.
이 논문은 새로운 환경에서 여러 사전 학습된 모델의 예측 오류를 식별하고 관리하기 위해 일관성 기반 귀납 추론을 적용하여, 개별 모델이나 기존 앙상블 방법보다 높은 정밀도와 재현율을 달성하는 프레임워크를 제안합니다.
이 논문은 불균형 회귀 문제에서 임계값 설정 없이 표적 밀도와 관련성을 기반으로 한 CART 기반 합성 샘플링 기법 (CARTGen-IR) 을 제안하여, 기존 생성 모델보다 빠르고 해석 가능한 방식으로 희귀한 목표값 영역을 효과적으로 보강하는 방법을 제시합니다.
이 논문은 소매 판매 예측을 위해 다양한 머신러닝 모델을 비교 분석한 결과, 복잡한 딥러닝 아키텍처보다 XGBoost 와 같은 트리 기반 앙상블 모델이 결측치와 간헐적 수요가 있는 실제 환경에서 더 우수한 성능을 보였음을 시사합니다.
이 논문은 강화학습 (RL) 의 한계를 보완하고 새로운 지식 습득을 가능하게 하기 위해 RL 과 온라인 파인튜닝을 교차적으로 수행하는 'ReLIFT'라는 새로운 훈련 방식을 제안하며, 이를 통해 기존 모델의 능력을 넘어선 추론 성능 향상과 데이터 효율성을 입증했습니다.
이 논문은 병렬 학습과 순차 추론을 동시에 지원하는 '접두어 스캔 가능 모델 (Prefix-Scannable Models)'이라는 새로운 범주를 정의하여 기존 아키텍처를 통합하고, 새로운 연산자를 통해 효율성과 표현력을 동시에 달성하는 모델을 제안합니다.
이 논문은 미분 프라이버시의 기본 정의와 이론적·실무적 진화를 개괄하고, 머신러닝 모델 학습 시 프라이버시를 보호하는 방법론과 평가 기법을 심층적으로 분석하여 안전하고 책임 있는 AI 시스템 개발에 기여하는 포괄적인 조사를 제공합니다.
이 논문은 실루엣 점수를 기반으로 데이터 포인트에 가중치를 부여하고 적응형 온도를 통해 경계점과 노이즈를 억제하여 -means 알고리즘의 클러스터링 성능을 향상시킨 K-Sil 알고리즘을 제안하고 그 유효성을 입증합니다.
이 논문은 기존 한아비 (Hanabi) 환경의 한계를 극복하고 제로샷 조율 (ZSC) 연구의 새로운 표준이 될 수 있도록, 불확실한 힌트와 이동하는 카드를 추적하며 공유된 신념을 구축해야 하는 새로운 다중 에이전트 강화학습 벤치마크인 '요카이 학습 환경 (YLE)'을 제안하고 기존 최첨단 방법론들의 한계를 입증합니다.
이 논문은 가우시안 보상을 가정하는 확률적 밴딧 환경에서 샤프 비율을 최적화하기 위한 톰슨 샘플링 알고리즘 (SRTS) 을 제안하고, 새로운 레그렛 분해 기법을 통해 로그 레그렛 상한과 하한을 유도하여 알고리즘의 차수 최적성을 증명합니다.
이 논문은 전역 제어 필드를 가진 아날로그 양자 시뮬레이터가 보편적 양자 연산이 가능함을 이론적으로 증명하고, '직접 양자 최적 제어' 기법을 통해 실제 실험에서 3 체 상호작용 및 위상 동역학을 구현하여 양자 정보 처리의 새로운 가능성을 제시합니다.
이 논문은 특정 모드 방향으로의 섬유 (fiber) 단위가 완전히 관측되거나 결측된 텐트 데이터에 대해, 확률적 가정이 아닌 결정론적 조건 하에서 표준 선형대수 연산만으로 텐서 트레인 분해를 수행하여 빠르고 효율적으로 텐서를 복원하는 새로운 방법을 제안합니다.
이 논문은 목적 함수가 변하는 매개변수 최적 제어 문제를 위해 오프라인에서 학습된 신경 기저 함수 집합을 활용하여, 온라인에서 데이터 투영이나 문제 명세 직접 매핑을 통해 재계산 없이도 실시간으로 최적에 가까운 제어를 수행할 수 있는 제로샷 전이 가능 솔루션 방법을 제안합니다.