cs.LG 편의 논문 | Gist.Science

Uncertainty-Aware Solar Flare Regression

이 논문은 태양 플레어 예측의 신뢰성을 높이기 위해 컨포멀 예측 기법을 적용한 회귀 모델을 제안하며, 특히 컨포멀라이즈드 양자 회귀가 다른 방법들보다 더 높은 커버리지와 적절한 구간 길이를 제공함을 실험을 통해 입증했습니다.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

이 논문은 작은 언어 모델 (SLM) 이 대규모 도구 환경에서도 효과적으로 작동할 수 있도록 컨텍스트 제어와 실행 구조를 학습 가능한 의사결정으로 간주하고, rubric 기반 강화 학습 미세 조정을 통해 긴 작업 흐름을 안정화하는 ATLAS 프레임워크를 제안합니다.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

이 논문은 MIMIC-IV 데이터를 기반으로 대규모 환자 인공 데이터를 생성하고, 자동 감사 모듈을 통해 임상적 일관성을 검증하여 기존 통계적 정확도 이상의 임상적 신뢰성과 개인정보 보호를 동시에 확보한 통합 파이프라인을 제안합니다.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

이 논문은 단백질 서열과 구조 간의 정렬을 학습하기 위해 대비 학습 패러다임을 도입하여, 공유 임베딩 공간을 구축함으로써 교차 모달 검색 및 하류 예측 작업의 성능을 향상시키는 'ProtAlign' 프레임워크를 제안합니다.

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

이 논문은 인간의 활동 정보를 양방향 피드백으로 융합하고 다중 시간尺度 모듈을 도입하여 실내 CO2 및 PM2.5 농도 변화를 정확하게 예측하고 불확실성을 추정하는 새로운 프레임워크를 제안합니다.

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

이 논문은 시계열 파운데이션 모델이 생성한 예측 특징을 회귀 모델에 통합하는 'FutureBoosting'이라는 새로운 하이브리드 AI 접근법을 제안하여, 전력 가격 예측의 정확도를 기존 최첨단 모델 대비 30% 이상 향상시켰다고 요약할 수 있습니다.

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

이 논문은 사전 훈련된 언어 모델의 레이어 사이에 명시적인 안전 비트를 삽입하여 모델의 안전 판단을 해석 가능하고 제어 가능하게 만들며, 경량 미세 조정을 통해 공격 성공률을 극도로 낮추는 'Safe Transformer' 아키텍처를 제안합니다.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

이 논문은 CoreML 을 우회하여 애플의 신경 엔진 (ANE) 을 직접 제어하고, 컴파일 재구성을 최적화하며 LoRA 어댑터를 지원하는 'Orion'이라는 오픈 소스 시스템을 통해 애플 기기에서 대규모 언어 모델의 온디바이스 학습과 추론을 가능하게 했음을 제시합니다.

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

이 논문은 밀도 불변 관찰 인코딩, 밀도 무작위화 훈련, 물리 기반 보상 설계 등을 통해 학습 기반 군중 내비게이션이 훈련 데이터 범위를 벗어난 고밀도 환경에서도 동결이나 충돌 없이 목표 지점에 도달할 수 있도록 하는 강화 학습 접근법을 제안합니다.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

이 논문은 MLIR 기반의 모듈형 컴파일러 인프라인 PolyBlocks 를 제안하여, 분석적 비용 모델과 휴리스틱을 활용한 자동 최적화를 통해 PyTorch 와 JAX 에서 Torch Inductor 나 XLA 와 경쟁력 있는 성능을 달성하고 새로운 AI 칩으로의 이식을 용이하게 한다는 내용을 담고 있습니다.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

이 논문은 베이지안 신경망, 공정성 제약이 적용된 그래디언트 부스팅, 그리고 시프트 인식 융합 전략을 결합하여 데이터 분포 변화와 공정성 요구사항 하에서도 신뢰할 수 있는 신용 위험 점수를 산출하는 '보정된 신용 지능 (CCI)' 프레임워크를 제안하고, 이를 통해 기존 모델 대비 우수한 판별력, 보정 정확도, 안정성 및 공정성을 입증합니다.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

이 논문은 FlashAttention 을 활용하여 초해상도 Transformer 의 확장성을 가능하게 하는 랭크 분해 암시적 신경 편향 (RIB) 을 제안하고, 이를 통해 기존 방법 대비 훈련 및 추론 시간을 획기적으로 단축하면서도 Urban100 데이터셋에서 35.63dB 의 높은 PSNR 성능을 달성했습니다.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

이 논문은 서로 다른 학습 목표 (DDPM 및 Flow Matching) 를 가진 전문가들을 동기화 없이 통합하고, 사전 학습된 체크포인트 변환과 효율적인 아키텍처를 통해 기존 분산 확산 모델 대비 연산 및 데이터 요구량을 획기적으로 줄이면서도 더 우수한 생성 품질을 달성하는 이질적 분산 확산 모델 프레임워크를 제안합니다.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

이 논문은 로봇 제어 및 자율 주행과 같은 복잡한 제약 조건 하에서 현실감을 유지하면서 사전 훈련된 생성 모델을 미세 조정하여 해당 제약 영역 내에서 직접 샘플을 생성하는 새로운 프레임워크를 제안합니다.

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

이 논문은 확산 언어 모델 (dLLMs) 에 적용 시 발생하는 보상 붕괴 문제를 해결하기 위해, 중요도 비율 추정의 노이즈로 인한 불안정성을 억제하고 dLLM 에 최적화된 안정적 강화 학습 알고리즘인 StableDRL 을 제안합니다.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

이 논문은 과도한 조향으로 인한 품질 저하를 방지하기 위해 가중치 조정과 가능성 기반 디코딩 루프를 결합하여 동적으로 조향 강도를 조절하는 새로운 방법인 DIRECTER 를 제안함으로써 대규모 언어 모델의 지시 따르기 능력을 향상시킵니다.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

이 논문은 구조적 충실도를 유지하면서 용해도와 열안정성 등 다양한 개발성 속성을 동시에 만족시키기 위해 사전 학습된 역접힘 모델을 다목적 선호도 정렬 (ProtAlign) 프레임워크로 미세 조정하는 새로운 방법을 제시합니다.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

이 논문은 비선형 역학 시스템에서 데이터 동화의 성능을 향상시키기 위해, 학습된 잠재 공간 내에서 선형적이고 안정적인 역학을 갖는 오토인코더 기반 앙상블 칼만 필터 (LAE-EnKF) 를 제안하고 그 이론적 근거와 수치적 유효성을 입증합니다.

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

이 논문은 양자 암시적 신경 표현 (QINR) 을 디코더에 통합한 하이브리드 오토인코더 및 변이형 오토인코더를 제안하여, 제한된 파라미터와 데이터로도 MNIST 등 다양한 데이터셋에서 고주파 특징이 풍부한 선명한 이미지 재구성과 생성이 가능하며 기존 양생성 모델보다 안정적이고 다양성이 높음을 입증합니다.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

이 논문은 불균형 데이터에서 소규모 개념의 드리프트를 대규로 개념의 영향으로부터 독립적으로 탐지하고 해석할 수 있도록 설계된 '불균형 클러스터 기술자 기반 드리프트 탐지 (ICD3)' 방법을 제안합니다.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

← 이전 다음 →