cs.LG 件の論文 | Gist.Science

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

本論文は、チャートの深層分析能力の向上に向けた課題として、多様な報酬信号やデータ間の競合を解消する並列相対方策最適化（PRPO）と、エラー注入に基づく客観的評価ベンチマーク（MCDR-Bench）を提案し、これらを通じてチャート深層分析のトレーニングと評価を体系的に改善する統合フレームワークを構築したことを示しています。

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

この論文は、事後サンプリングにおける推定誤差を軽減し、より高品質な生成を実現するために、追加の逆方向ノイズ除去ステップとモンテカルロサンプリングを組み合わせたプラグアンドプレイ手法「ABMS」を提案し、理論的解析と多様なタスクにおける実験を通じてその有効性を証明したものである。

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

この論文は、訓練データが存在しない条件下でも、畳み込みフィルタリングと最適化された早期停止戦略を用いた教師なし学習フレームワークにより、高エネルギー加速器のビーム診断において低信号対雑音比環境でのビームエミッタンス画像の高精度な復元とビームハローの解像度向上を実現する手法を提案しています。

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

One step further with Monte-Carlo sampler to guide diffusion better

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Soft Equivariance Regularization for Invariant Self-Supervised Learning

On the Generalization Capacities of MLLMs for Spatial Intelligence

Uncertainty-Aware Solar Flare Regression

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Heterogeneous Decentralized Diffusion Models

Improved Constrained Generation by Bridging Pretrained Generative Models

Stabilizing Reinforcement Learning for Diffusion Language Models