cs.LG 件の論文 | Gist.Science

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

この論文は、関数エンコーダ方策を用いたニューラル基底関数の事前学習とオンラインでの軽量係数推定により、目的関数が変化するパラメータ最適制御問題に対して、従来の最適化手法に比べて計算コストを大幅に削減しつつ、ほぼ最適な性能でゼロショット適応を可能にする転移可能な解法を提案しています。

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

本論文は、SigLIP モデルで採用されているシグモイド損失関数における可学習な逆温度とバイアスの同期が、 $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -Constellations と呼ばれる新たな組合せ的構造を介して損失をゼロに導くことを理論的に解明し、これにより SigLIP の検索性能の成功や CLIP におけるモダリティギャップの存在、高品質な表現を得るための必要な次元数を説明するとともに、実験的にトレーニングダイナミクスを改善する損失関数の再パラメータ化を提案しています。

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

← 前へ次へ →

cs.LG

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Global Minimizers of Sigmoid Contrastive Loss

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Proposing a Framework for Machine Learning Adoption on Legacy Systems

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

Composer: A Search Framework for Hybrid Neural Architecture Design

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

Absolute indices for determining compactness, separability and number of clusters

Predicting kernel regression learning curves from only raw data statistics

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

KV Cache Transform Coding for Compact Storage in LLM Inference

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

Towards Causal Market Simulators