cs.LG 편의 논문 | Gist.Science

Some Super-approximation Rates of ReLU Neural Networks for Korobov Functions

이 논문은 희소 격자 유한 요소와 비트 추출 기법을 활용하여 ReLU 신경망이 코로보프 함수를 근사할 때 차원의 저주에 거의 영향을 받지 않는 거의 최적의 초근사 오차 한계를 증명합니다.

Yuwen Li, Guozhi Zhang2026-03-06💻 cs

Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games

이 논문은 무한 시간 평균장 게임에서 RKHS 기반의 최대 인과 엔트로피 역강화학습을 제안하여, 기존 선형 보상 모델의 한계를 극복하고 비선형 보상 구조를 효과적으로 학습하며 이론적 일관성과 실제 교통 시나리오에서의 우수성을 입증합니다.

Berkay Anahtarci, Can Deha Kariksiz, Naci Saldi2026-03-06🔢 math

Elucidating the Design Space of Arbitrary-Noise-Based Diffusion Models

이 논문은 고정된 가우시안 노이즈의 한계를 극복하고 다양한 노이즈 패턴을 처리하여 이미지 복원 성능을 향상시키기 위해, 임의의 노이즈를 기반으로 한 확산 모델의 설계 공간을 체계적으로 규명하는 새로운 프레임워크인 EDA 를 제안합니다.

Xingyu Qiu, Mengying Yang, Xinghua Ma + 6 more2026-03-06💻 cs

Structured quantum learning via em algorithm for Boltzmann machines

이 논문은 양자 볼츠만 머신의 학습을 방해하는 barren plateau 문제를 극복하기 위해, 기댓값 - 최대화 (EM) 알고리즘을 양자 버전으로 확장하여 반양자 제한 볼츠만 머신 (sqRBM) 에 적용함으로써 경사 하강법보다 안정적이고 확장 가능한 학습 방법을 제시합니다.

Takeshi Kimura, Kohtaro Kato, Masahito Hayashi2026-03-06⚛️ quant-ph

TIC-GRPO: Provable and Efficient Optimization for Reinforcement Learning from Human Feedback

이 논문은 GRPO 의 이론적 한계를 분석하고, 토큰 수준의 중요도 샘플링을 경로 수준의 보정으로 대체하여 수렴 속도와 성능을 모두 개선한 새로운 알고리즘 TIC-GRPO 를 제안하고 실험적으로 검증합니다.

Lei Pang, Jun Luo, Ruinan Jin2026-03-06💻 cs

Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection

이 논문은 불균형 데이터와 전문가 간 합의 등 신생아 발작 검출의 고유한 과제를 고려하여, 기존 평가 방식의 한계를 지적하고 균형 잡힌 지표, 민감도/특이도 등 필수 메트릭, 그리고 Fleiss Kappa 기반의 다수 전문가 터링 테스트를 포함한 엄격한 평가 프레임워크를 제안함으로써 임상 적용을 위한 AI 모델의 신뢰성 있는 검증을 촉구합니다.

Jovana Kljajic, John M. O'Toole, Robert Hogan + 1 more2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

이 논문은 API 를 통한 파인튜닝 시 발생할 수 있는 돌발적 정렬 불일치 (EMA) 를 방지하기 위해 네 가지 훈련 중 규제 기법을 체계적으로 평가한 결과, 정렬된 모델과 오정렬된 모델 간의 퍼플렉시티 차이로 데이터를 선별하여 일반 지시 튜닝 데이터를 교차 학습하는 방식이 가장 효과적임을 밝혔습니다.

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs

Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings

이 논문은 소수의 선호도 데이터만 제거해도 Chatbot Arena 와 같은 주요 LLM 랭킹 시스템의 최상위 모델 순서가 뒤바뀔 수 있음을 보여주며, MT-bench 의 전문가 기반 평가가 더 강건하고 인간 평가와 LLM 평가 간 민감도 차이는 체계적으로 존재하지 않음을 밝힙니다.

Jenny Y. Huang, Yunyi Shen, Dennis Wei + 1 more2026-03-06💻 cs

How Quantization Shapes Bias in Large Language Models

이 논문은 양자화가 모델의 독성 감소에는 기여하지만, 특히 공격적인 압축 시 편견과 불공정성을 약간 증가시킬 수 있음을 다양한 벤치마크와 하위 그룹을 통해 분석하며, 효율성과 윤리적 고려 사항 간의 균형을 강조합니다.

Federico Marcuzzi, Xuefei Ning, Roy Schwartz + 1 more2026-03-06💻 cs

Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey

이 논문은 교통 신호 제어, 자율주행 차량 조정, 물류 최적화 등 지능형 교통 시스템 (ITS) 의 핵심 과제 해결을 위한 다중 에이전트 강화 학습 (MARL) 의 방법론, 적용 사례, 시뮬레이션 플랫폼 및 현실 세계 배포를 가로막는 주요 과제들을 체계적으로 조사하고 있습니다.

Rexcharles Donatus, Kumater Ter, Daniel Udekwe2026-03-06💻 cs

A Geometric Perspective on the Difficulties of Learning GNN-based SAT Solvers

이 논문은 그래프 리치 곡률을 기반으로 GNN 기반 SAT 솔버의 학습 어려움을 기하학적으로 설명하며, 난이도가 높은 SAT 인스턴스가 본질적으로 음의 곡률을 가지며 이로 인해 GNN 의 오버스쿼싱 현상이 발생하여 성능이 저하됨을 증명하고 곡률이 문제 복잡성과 일반화 오차를 예측하는 강력한 지표임을 실증적으로 확인합니다.

Geri Skenderi2026-03-06🔬 physics

New Insights into Optimal Alignment of Acoustic and Linguistic Representations for Knowledge Transfer in ASR

이 논문은 자동 음성 인식 (ASR) 에서 지식 전이를 위해 음향 및 언어 표현 간의 정렬을 검출 문제로 재해석하고, 불균형 최적 수송을 기반으로 한 새로운 정렬 모델을 제안하여 구조적 비대칭성과 불일치를 효과적으로 처리함으로써 ASR 성능을 향상시킨다는 것을 보여줍니다.

Xugang Lu, Peng Shen, Hisashi Kawai2026-03-06💻 cs

AttnBoost: Retail Supply Chain Sales Insights via Gradient Boosting Perspective

이 논문은 노이즈가 많고 이질적인 특성을 가진 소매 공급망 수요 예측 문제를 해결하기 위해, 각 부스팅 라운드에서 특징 중요도를 동적으로 조정하여 예측 정확도와 해석 가능성을 동시에 향상시킨 새로운 프레임워크인 'AttnBoost'를 제안하고 그 유효성을 입증합니다.

Yadi Liu, Xiaoli Ma, Muxin Ge + 6 more2026-03-06💻 cs

Topology Structure Optimization of Reservoirs Using GLMY Homology

이 논문은 지속적 GLMY 호몰로지 이론을 활용하여 저수지 네트워크의 1 차 호몰로지 군을 분석하고 최소 대표 사이클을 수정하는 구조 최적화 방법을 제안함으로써 성능을 향상시키는 것을 목표로 합니다.

Yu Chen, Shengwei Wang, Hongwei Lin2026-03-06💻 cs

TabStruct: Measuring Structural Fidelity of Tabular Data

이 논문은 실제 데이터의 인과 구조를 알 수 없는 상황에서도 구조적 충실도와 기존 평가 지표를 종합적으로 분석할 수 있는 새로운 평가 지표인 '글로벌 유틸리티'를 제안하고, 29 개의 데이터셋과 13 개의 생성 모델을 대상으로 한 포괄적인 벤치마크 'TabStruct'를 구축하여 표제 데이터 생성 모델의 성능을 평가하는 프레임워크를 제시합니다.

Xiangjian Jiang, Nikola Simidjievski, Mateja Jamnik2026-03-06💻 cs

BabyHuBERT: Multilingual Self-Supervised Learning for Segmenting Speakers in Child-Centered Long-Form Recordings

이 논문은 40 개 이상의 언어로 된 1 만 3,000 시간 분량의 아동 중심 녹음 데이터를 기반으로 학습된 자기지도 학습 모델 'BabyHuBERT'를 제안하여, 기존 성인용 모델보다 다양한 언어 환경에서 아동과 성인의 음성을 구분하는 성능을 크게 향상시켰다고 요약할 수 있습니다.

Théo Charlot, Tarek Kunze, Maxime Poli + 3 more2026-03-06💻 cs

Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks

이 논문은 Apple Vision Pro 를 통한 원격 조작으로 수집된 데이터를 기반으로 트랜스포머 기반 확산 모델을 활용해 외부 힘에 반응하여 임피던스 파라미터를 실시간으로 적응시키는 'Diffusion-Based Impedance Learning' 프레임워크를 제안하여, 복잡한 접촉 작업에서 정밀하고 안정적인 로봇 조작을 가능하게 합니다.

Noah Geiger, Tamim Asfour, Neville Hogan + 1 more2026-03-06💻 cs

Complexity-Regularized Proximal Policy Optimization

이 논문은 엔트로피 정규화의 한계를 극복하기 위해 무질서와 질서의 균형을 반영하는 '복잡도' 항을 도입한 새로운 강화학습 알고리즘 CR-PPO 를 제안하며, 이를 통해 하이퍼파라미터 튜닝에 대한 의존성을 줄이고 학습의 안정성을 크게 향상시켰음을 보여줍니다.

Luca Serfilippi, Giorgio Franceschelli, Antonio Corradi + 1 more2026-03-06💻 cs

Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription

이 논문은 드럼 자동 전사를 판별적 작업이 아닌 생성적 작업으로 재정의하고, 음악 기반 모델의 특징을 활용하여 온셋과 속도를 동시에 최적화하는 확산 기반 프레임워크 'Noise-to-Notes(N2N)'를 제안함으로써 여러 벤치마크에서 새로운 최고 성능을 달성했다고 요약할 수 있습니다.

Michael Yeung, Keisuke Toyama, Toya Teramoto + 2 more2026-03-06💻 cs

BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving

이 논문은 폐루프 자율주행 환경에서 안전하고 반응적인 궤적 계획을 위해 전진 및 역과정의 이론적 일관성을 보장하는 '브릿지드라이브 (BridgeDrive)'라는 새로운 앵커 기반 확산 브리지 정책을 제안하고, Bench2Drive 벤치마크에서 기존 최첨단 방법론보다 성공률을 크게 향상시킨 결과를 제시합니다.

Shu Liu, Wenlin Chen, Weihao Li + 7 more2026-03-06💻 cs

← 이전 다음 →