Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training
本論文は、テスト時学習(TTT)を用いて高速重みを適応させ、3D 空間予測メカニズムと大規模データセットを組み合わせることで、無限の動画ストリームから効率的に空間情報を維持・更新し、長期的な空間理解を実現する「Spatial-TTT」を提案するものである。
2315 件の論文
本論文は、テスト時学習(TTT)を用いて高速重みを適応させ、3D 空間予測メカニズムと大規模データセットを組み合わせることで、無限の動画ストリームから効率的に空間情報を維持・更新し、長期的な空間理解を実現する「Spatial-TTT」を提案するものである。
FLUX.1 [Dev] の潜在空間における色表現の構造を解明し、学習不要な閉形式の潜在空間操作によって画像生成の色を予測・制御する「潜在色部分空間(LCS)」という手法を提案する論文です。
BEFANA は、生態ネットワークのトポロジーやダイナミクス、および機械学習を用いた予測モデリングを、対話的な計算ノートブック形式で可能にする、生物多様性と生態系機能の評価のためのオープンソースツールです。
この論文は、ラプラス近似に基づく効率的なベイズ更新を導入することで、深層能動学習におけるモデルの再学習コストを削減しつつ、バッチ内の多様性を確保する新しいフレームワークと先見型選択戦略を提案し、従来の再学習と同等の精度を大幅な計算速度向上で達成できることを示しています。
この論文は、グループ公平性と個人公平性の両方を表現する新たな指標「discriminative risk」を提案し、マージン依存の理論的保証に基づいてアンサンブル組み合わせによる公平性の向上と、精度と公平性の両立を実現するアンサンブル剪定手法を導出するものである。
この論文は、Google Brain の深層強化学習を用いたマクロ配置手法(Circuit Training)について、より強力なシミュレーテッド・アニーリング手法や商用ツールを用いた真の報酬評価、および新しいナノメートル級ベンチマークを通じて再評価を行い、再現性やスケーラビリティに関する未解決の課題を浮き彫りにしています。
この論文は、既存のヒューリスティック手法では得られなかった最適性の証明を可能にするため、低ランク行列補完問題を射影行列の非凸集合上の凸問題として再定式化し、離散的な分枝限定法と新たな凸緩和法を組み合わせることで、大規模な問題においても証明可能な最適解またはそれに極めて近い解を効率的に導出する手法を提案しています。
本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心(NLSOM)」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。
この論文は、フィッシャー計量を用いたリーマン・ラプラス近似が無限データ極限においてもバイアスや過剰な狭さという欠点を持つことを示し、これを修正する 2 つの新しい変法を開発して理論的解析を深め、実験を通じてその実用性の向上を実証しています。
この論文は、ゼロショットプロンプティングと LLM 生成テキスト埋め込みの 2 つの枠組みを用いて大規模言語モデル(LLM)を交通行動予測に応用し、従来の統計モデルや機械学習モデルと同等かそれ以上の性能を達成できることを実証しています。
この論文は、分散環境で個別に学習されたミクスチャ・オブ・エキスパート(MoE)モデルを、標準的な平均化ではなく最適輸送に基づく枠組みで効率的に集約し、通信コストを最小化しながら中央集権的な訓練と同等の性能を実現する手法を提案しています。
この論文は、マルチモーダル連合学習における通信効率とクライアント・モダリティの多様性という課題に対し、エンコーダと融合モジュールを分離するアーキテクチャと、シャプレイ値や通信オーバーヘッドなどを考慮した選択アルゴリズムを提案し、通信オーバーヘッドを 20 倍以上削減しながら高精度な学習を実現する「MFedMC」というフレームワークを提示しています。
本論文は、大規模言語モデルの構造化プルーニングにおいて、微細粒度と粗粒度の重み重要度評価を適応的に融合する「HyWIA」手法を提案し、既存手法を上回る性能を達成することを示しています。
この論文は、大規模な画像分類タスクにおける計算コストとメモリ制約を克服するため、フィッシャー情報量の近似と二値分類タスクの構築によって BAIT アルゴリズムの効率性とスケーラビリティを大幅に向上させる手法を提案し、ImageNet などの大規模データセットでも高性能を維持しながら実行可能にしたことを示しています。
この研究は、28 年間の監視データを用いた説明可能な機械学習(ランダムフォレスト)により、アドリア海(トリエステ湾)におけるムラサキガイの DSP 中毒発生を予測し、Dinophysis 属の種や塩分・河川流量・降水量などの主要な予測因子を特定することで、早期警戒システムの改善と持続可能な養殖の実現に貢献しました。
この論文は、ランダム化停止時間と累積残差エントロピー正則化を用いて最適停止問題を特異制御問題として定式化し、その解を導出するモデルベースおよびモデルフリーの強化学習アルゴリズムを提案し、その収束保証と高次元への拡張性を示しています。
この論文は、偏微分方程式(PDE)の求解において、従来のトランスフォーマーの限界を克服し、構造化状態空間モデル(SSM)の特性を活用して長距離依存性と連続的なダイナミクスをより効果的に捉える「Mamba Neural Operator(MNO)」という新たな枠組みを提案し、その理論的基盤と優れた性能を実証しています。
この論文は、データ漏洩や主要な地震列の欠落などの課題を解決し、地震学コミュニティの標準的な評価基準を用いてニューラル・ポイント・プロセス(NPP)と古典的な ETAS モデルを比較した新たなベンチマーク「EarthquakeNPP」を提案し、その結果、現状の NPP は ETAS よりも優れた地震予測性能を示さなかったことを報告しています。
この論文は、拡散モデルが学習データを記憶する過程が急激な変化ではなく、データ不足に伴い潜在次元が滑らかに減少し、重要な特徴から順に詳細が凍結して最終的に点ごとの複製に至る「幾何学的記憶」と呼ばれる段階的現象であることを理論的・実験的に明らかにしたものである。
この論文は、物理的な逆解を初期推定値として用い、3D 畳み込み U-Net でデータ駆動型の事前知識を統合するハイブリッド手法「3D-PIUNet」を提案し、従来の手法やエンドツーエンドの深層学習法よりも優れた空間精度で脳源再構成を実現することを示しています。