cs.LG 편의 논문 | Gist.Science

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

이 논문은 다차원 보상 간섭과 이질적 데이터 경계 충돌을 해결하는 병렬 상대적 정책 최적화 (PRPO) 와 제어된 오류 주입을 통한 객관적 평가를 가능하게 하는 MCDR-Bench 를 제안하여, 차트 데이터의 심층 연구 능력을 체계적으로 향상시키는 통합 프레임워크를 구축했습니다.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

이 논문은 기존 무조건부 생성 모델의 추정 오차 문제를 해결하기 위해 추가적인 역방향 디노이징 단계와 몬테카를로 샘플링을 결합한 ABMS 기법을 제안하여, 다양한 조건부 생성 작업에서 생성 품질을 일관되게 향상시킵니다.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

이 논문은 학습 데이터가 부재한 환경에서도 심한 노이즈가 포함된 입자 가속기 빔 진단 데이터를 위해, 합성곱 필터링과 최적화된 조기 종료 전략을 활용한 비지도 학습 프레임워크를 제안하여 빔 헤일로 구조를 7 표준편차 이상으로 정밀하게 재구성하고 에미턴스를 고충실도로 복원하는 방법을 소개합니다.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

← 이전 다음 →

cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

One step further with Monte-Carlo sampler to guide diffusion better

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Soft Equivariance Regularization for Invariant Self-Supervised Learning

On the Generalization Capacities of MLLMs for Spatial Intelligence

Uncertainty-Aware Solar Flare Regression

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Heterogeneous Decentralized Diffusion Models

Improved Constrained Generation by Bridging Pretrained Generative Models

Stabilizing Reinforcement Learning for Diffusion Language Models