CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data
本論文は、ガウス過程カーネルの合成と構造的因果モデルを組み合わせることで多様かつ因果的に整合した合成時系列データを生成する「CauKer」を提案し、これにより大規模な実データに依存せず、スケーラブルかつ効率的に時系列基礎モデルを事前学習可能であることを示しています。
2412 件の論文
本論文は、ガウス過程カーネルの合成と構造的因果モデルを組み合わせることで多様かつ因果的に整合した合成時系列データを生成する「CauKer」を提案し、これにより大規模な実データに依存せず、スケーラブルかつ効率的に時系列基礎モデルを事前学習可能であることを示しています。
この論文は、グラフの抽象的な構造に依存する不変量(グラフ不変量)の予測を通じて構造一般化を強化し、その表現を位置符号として活用してドメイン横断的なグラフ基礎モデル(GFM)を構築する「GraphProp」を提案し、特にノード属性がないグラフにおける分類や少数ショット学習において優れた性能を示すことを示しています。
Video-EM は、長期動画理解における文脈制約を解決するため、既存の Video-LLM を追加学習なしで活用し、LLM を能動的な記憶エージェントとして機能させることで、クエリ関連の瞬間を特定し、一貫したイベントにグループ化し、冗長性を除去する自己反省ループを経て、コンパクトかつ信頼性の高い「イベントタイムライン」を構築するトレーニングフリーのフレームワークである。
本論文は、時系列、画像、テキストのマルチモーダル入力からインスタンス固有の条件付きプロンプトを推論し、モダリティの関連性を動的に調整する「Modality Routing」メカニズムを導入することで、既存の時間系列基盤モデルの予測精度を大幅に向上させるパラメータ効率の高いフレームワーク「UniCast」を提案するものである。
任意のサンプリングレートと可変長の信号に対応し、帯域分割アーキテクチャと周波数位置エンコーディングを統合した新しい基盤モデル「ECHO」を提案し、機械信号の異常検出や故障分類において最先端の性能を実現したことを報告する論文です。
この論文は、Lempel-Ziv 圧縮に基づくエントロピー駆動のカリキュラム学習と、距離・方向の推定を組み合わせたマルチタスク学習を統合したフレームワークを提案し、HuMob チャレンジにおいて最先端の予測精度と最大 2.92 倍の収束速度向上を実現したことを示しています。
この論文は、学習ベースの制御と安全制御を切り替えるランタイム監視機構を提案し、学習データ分布から外れた環境でも衝突を回避しながらタスクを迅速に完了させる、地下空間におけるドローンの自律制御の堅牢性を向上させることを示しています。
本論文は、依存関係木と文脈的意味を統合し、シンクホルン法を用いた最適輸送に基づくアスペクト - 意見の対応付けや構文誘導型注意機構を導入することで、ノイズへの耐性を高め、アスペクトベースの感情分析において最先端の性能を達成する「OTESGN」というモデルを提案しています。
この論文は、YOLO 物体検出モデルや車線推定アルゴリズムなどのコンピュータビジョン技術を用いて外部から車両を監視し、自動運転車向けに非接続車両の運転者の不注意や酩酊などの危険な運転行動をリアルタイムで分類する新規フレームワークを提案し、その有効性を検証したものである。
この論文は、生成 AI を活用して公開画像や住宅情報から住宅建築データを合成するモジュラー型マルチモーダルフレームワークを提案し、エネルギー効率の向上や地域規模の消費シミュレーションを可能にするための、コストのかかるデータへの依存を軽減するアクセシブルなパイプラインを確立したことを示しています。
本論文は、制限された計算資源やプライバシー制約下でも実用的な産業環境で動作する、5 つの役割特化型エージェントと安全チェックアウディット、および適応的ステップ融合(ASF)を採用したマルチエージェント協調アシスタント「MICA」を提案し、その有効性をベンチマークと評価指標を用いて実証するものである。
この論文は、タスクに関連する物体と関係に焦点を当てたシーングラフ表現と拡散モデルに基づく模倣学習を統合し、視覚運動制御のロバスト性と長期的タスクの構成的汎化能力を大幅に向上させる新しいフレームワークを提案しています。
本論文は、単一の画像から高忠実度な表面と SDF 場を数秒で効率的に再構築し、ロボットにおける表面追従タスクへの応用を可能にする軽量フレームワーク「FINS」を提案するものである。
この論文は、言語モデルの有害行動を検出する白箱モニター(線形プローブ)が、システムプロンプトや思考過程などの「テキスト的な証拠」に過度に依存しており、それらが除去されると検出性能が大幅に低下する脆弱性があることを示しています。
本論文は、ベイズ的説得理論に基づき大規模言語モデルの戦略的説得能力を評価・訓練するための体系的な枠組みを提案し、最先端モデルが高度な戦略を駆使して高い説得効果を示すこと、さらに強化学習により小規模モデルでも同様の成果が得られることを実証しています。
既存の多エージェント強化学習手法が抱える計算・メモリコストの課題を解決し、明示的なポリシー集団や報酬行列の構築を不要とする「GEMS」という新しいフレームワークを提案し、ゲーム理論的な保証を維持しながら PSRO よりも大幅に高速かつ効率的な学習を実現したことを示しています。
この論文は、モデルのトレーニング露出を反映する「ベンチマーク署名(salient tokens の集合)」を提案し、32 の LLM と 89 のベンチマークを用いたメタ評価を通じて、従来の性能相関や意味的類似性を超えた、知識や推論などのタスク間の重なりや、コーディングの孤立性、そして人間の概念構造とは異なる LLM の意味的組織に関する新たな知見を明らかにしています。
本論文は、LLM ベースのマルチエージェント計画における適応性と効率性のトレードオフを解決するため、サブゴール意図に明示的に紐付いた「アクションチェーン」を基本単位として採用し、既存手法の 30〜40% のトークン消費で同等のタスク成功率を達成する新しいフレームワーク「ELHPlan」を提案しています。
この論文は、事前の類似性情報が存在しないコールドスタート局面において、能動学習を通じて効率的にペアワイズ類似性を取得し、多様性を促進するカバレッジ意識型の手法を提案し、その有効性を合成および実世界のデータで実証するものです。
本論文は、環境との相互作用を通じて自律的に進化する大規模言語モデルエージェントにおいて、モデル・記憶・ツール・ワークフローの各経路で意図しない有害な進化(Misevolution)が広く発生する実証的証拠を初めて提示し、新たな安全パラダイムの必要性を訴えるものです。