Hierarchical topological clustering
本論文は、任意の距離尺度を用いて任意の形状のクラスターや外れ値を階層的に特定できる、データ構造の仮定を必要としない新しいトポロジカル・クラスタリング手法を提案しています。
327 件の論文
物理学のデータ分析分野は、膨大な実験データやシミュレーション結果から新たな法則や現象を読み解く、現代物理学の重要な基盤です。Gist.Science では、arXiv から公開されるこの分野の最新プレプリントを網羅的に収集し、専門用語に頼らない平易な解説と、技術的な詳細を両方備えた要約を即座に提供しています。これにより、研究者だけでなく、物理学の進展に興味を持つ一般の方々も、最先端の知見に容易にアクセスできるようになります。
私たちの取り組みは、複雑な数式や統計手法の背後にある核心的な発見を、誰もが理解できる形に変えることにあります。arXiv 上で公開される新しい論文一つひとつを丁寧に処理し、その価値を最大限に引き出すことで、科学の民主化を推進します。以下に、この分野の最新研究論文の一覧を示します。
本論文は、任意の距離尺度を用いて任意の形状のクラスターや外れ値を階層的に特定できる、データ構造の仮定を必要としない新しいトポロジカル・クラスタリング手法を提案しています。
本論文は、ガウス過程を用いてポアソン対数正規分布をモデル化することで、従来のパラメトリック手法では困難だった複雑な非線形依存関係を持つカウントデータ(整数値データ)の予測や、背景ノイズからの微弱な信号検出を非パラメトリックに行う新手法「PoLoN」を提案しています。
この論文は、カウント比ではなくポアソン平均の比を対象とした、ベイズモデリングによる比率の不確実性評価を行うためのRパッケージ「PoissonRatioUQ」を提案するものです。
本論文は、無限幅の2層ニューラルネットワークにおける大バッチ確率的勾配降下法のダイナミクスを、テンソルプログラムと特異摂動論を用いた「高速・低速な時間スケール」の解析によって解明し、特徴量の忘却(feature unlearning)が発生するメカニズムと条件を理論的・数値的に明らかにしたものです。
DerivKitは、自動微分が困難なモデルに対しても安定した数値微分を提供することで、高速なフィッシャー情報行列による予測と計算負荷の高いMCMCサンプリング手法を、高次近似(DALI)を通じて橋渡しするPythonパッケージです。
本論文は、予測に必要な潜在変数の次元数(タスク関連次元)を推定する問題を情報ボトルネック問題として定式化し、既存の推定手法のバイアスを解消するハイブリッドな評価器と、単一のモデルから次元数を直接読み取る手法を提案することで、物理データ等の複雑なデータにおける高精度な次元推定を実現した研究です。
本論文は、量子リソースの生成や伝送過程で生じる非独立同一分布(non-i.i.d.)な試行に対しても、平均的な性能を高い信頼度で効率的に検証できる、逐次的なスポットチェック手法を提案しています。