Taking Shortcuts for Categorical VQA Using Super Neurons
この論文は、視覚言語モデルの生きた活性化値(スカラー値)を直接探ることで「スーパーニューロン」を発見し、これを用いることで従来のネットワークに比べて最大 5.10 倍の高速化を実現しつつ、カテゴリー別 VQA タスクの分類精度を向上させることを提案しています。
4825 件の論文
この論文は、視覚言語モデルの生きた活性化値(スカラー値)を直接探ることで「スーパーニューロン」を発見し、これを用いることで従来のネットワークに比べて最大 5.10 倍の高速化を実現しつつ、カテゴリー別 VQA タスクの分類精度を向上させることを提案しています。
この論文は、5G/6G のネットワーク計画において、空間的自己相関によるデータリークを軽減し、文脈を考慮した二段階分割戦略と残差空間誤差補正を組み合わせた AI フレームワークを提案し、カナダの主要都市での実証実験により予測精度の向上と信頼性の高い帯域幅割り当ての実現を立証したものです。
本論文は、公共の展開記録からスペクトル需要の代理指標を構築し、階層的マルチ解像度のグラフ注意ネットワーク(HR-GAT)を用いて微細な空間スケールでの需要を高精度に推定することで、無線ネットワークにおけるスペクトル共有と割り当てを支援する新しい手法を提案しています。
この論文は、拡散モデルを事前分布として用いた潜在空間最適化フレームワーク「MCCOP」を提案し、タンパク質の望ましい特性を達成するための最小かつ生物学的に妥当な変異を特定することで、機械学習モデルの解釈性とタンパク質設計の指針を提供するものである。
この論文は、敵対的攻撃に対する軌道予測モデルの堅牢性を向上させつつ、通常時の精度を維持できる簡便かつ計算コストの低い防御手法として、ランダム化スムージングを提案し、その有効性を検証したものである。
ReTabSyn は、強化学習を用いて特徴量間の相関を直接評価し、条件付き分布の学習を優先させることで、データ不足や不均衡といった制約下でも下流タスクの性能を向上させる現実的な表形式データ合成パイプラインを提案するものである。
この論文は、データ不足に直面する NPU などのニッチなハードウェア生態系におけるカーネル合成の課題を解決するため、価値駆動型のメモリ機構と強化学習を用いて、大規模言語モデルがゼロスタートから自律的にカーネルを生成・改善するエージェントフレームワーク「EvoKernel」を提案し、大幅な正解率と高速化の向上を実証したものである。
この論文は、事前学習された汎用価値モデルを事前分布として活用し、リアルタイム統計検定に基づいて希薄なロールアウトの予算を動的に割り当てることで、推定誤差を最小化し安定した方策勾配を実現する新しい価値モデル「V0.5」を提案し、数学的推論ベンチマークにおいて既存手法を大幅に上回る性能を示したことを述べています。
本論文は、EnMAP 衛星の hyperspectral 画像の大気補正を自動化し、特に水域における高精度な水面反射率の取得を可能にする、6S モデルと Google Earth Engine API を統合したオープンソース Python フレームワーク「6ABOS」を提案し、地中海の 2 つの貯水池での実証によりその有効性を示したものである。
本論文は、GWAS に基づく変異選択と条件付き潜在拡散モデルを組み合わせ、表現型情報を反映した合成遺伝子型データを生成し、プライバシーを保護しつつ下流の予測タスクで実データに匹敵する性能を発揮する「SNPgen」と呼ばれるフレームワークを提案するものである。
この論文は、低 SNR や被験者間のばらつきといった課題に対処するため、InceptionTime エンコーダにローレンツ注意モジュールを統合し、全被験者に共通する基底信号の学習と被験者固有の埋め込みの獲得を通じて、クロス被験者 EEG 分類の性能を飛躍的に向上させる新たなフレームワーク「LAtte」を提案するものです。
この論文は、U-Net 基盤をトランスフォーマーと 2D CNN エンコーダーに置き換えたパラメータ効率の高い拡散トランスフォーマー(DiT)を提案し、細胞特異的な調節 DNA 配列の生成において、従来モデルよりもはるかに少ないエポック数で収束し、過学習を抑制するとともに、Enformer を報酬モデルとした DDPO 微調整により予測される調節活性を劇的に向上させたことを示しています。
この論文は、従来の適合度検定の限界を克服し、分布間の統計的に意味のある差異の不在を評価するための、カーネル・スタイン不一致と最大平均不一致を用いた新しい等価性検定手法を提案し、その漸近正規性近似およびブートストラップ法に基づく臨界値の計算方法を提示しています。
この論文は、大規模推論モデルの強化学習ファインチューニングにおいて、コストのかかるロールアウトを伴う従来のオンラインプロンプト選択手法の問題を解決するため、学習ダイナミクスを隠れマルコフモデルでモデル化しベイズ推論を用いて事前予測を行う「Dynamics-Predictive Sampling (DPS)」を提案し、不要な計算コストを削減しながら推論性能を向上させることを示しています。
この論文は、強化学習において非エルゴード的な報酬過程が存在する場合、個々のエージェントの長期パフォーマンスを最適化するために期待値ではなく単一軌道の平均を重視する必要性と、その解決策について論じています。
本論文は、ドラフト生成を不要としながら将来の情報を活用して KV キャッシュの重要度を高精度に予測する軽量フレームワーク「LookaheadKV」を提案し、既存の手法よりもはるかに低いコストで長文脈タスクにおけるエビクション精度と推論速度を大幅に向上させることを示しています。
この論文は、ランク・スコア特性関数と認知的多様性を用いた組み合わせ融合分析(CFA)を適用して 2024 年の NCAA 大会データを分析し、既存の 10 大公的ランキングシステムを上回る 74.60% の予測精度を達成したことを報告しています。
本論文は、自動車内での時間系列異常検出において、精度だけでなく制約のある計算リソース下での実用性を評価する新しいプロトコル「ECoLAD」を提案し、軽量な古典的検出器が深層学習手法よりも厳しいスループット制約下でも安定した検出性能を維持できることを実証しています。
本論文は、複数のガウス混合モデルクラスタリングの制約を反復的に選択・最適化する「Historical Consensus Training」を導入することで、アーキテクチャの制約やハイパーパラメータの調整なしに、変分オートエンコーダにおける後方崩壊を根本的に防止し、安定した潜在表現を学習可能にする手法を提案しています。
この論文は、合成データが訓練データに含まれる個人を特定する「メンバーシップ推論攻撃」にどの程度脆弱かを評価するため、カーネル密度推定を用いた実用的なリスク定量化手法を提案し、既存の手法よりも高い精度でリスクを評価できることを示しています。