Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs
この論文は、従来のハードスパースティの限界を克服し、最上位ビット(MSB)を代理として利用する「ソフトスパースティ」パラダイムを提案することで、ReLU および Tanh 活性化関数を用いた CNN の推論において、精度を損なわずに乗算演算を大幅に削減し、エッジデバイス向けに電力効率を向上させる手法を提示しています。
4314 件の論文
この論文は、従来のハードスパースティの限界を克服し、最上位ビット(MSB)を代理として利用する「ソフトスパースティ」パラダイムを提案することで、ReLU および Tanh 活性化関数を用いた CNN の推論において、精度を損なわずに乗算演算を大幅に削減し、エッジデバイス向けに電力効率を向上させる手法を提示しています。
この論文は、最終的な正解だけでなく中間推論ステップの正しさも考慮する対照学習を組み込んだ CLIPO を提案し、LLM の推論におけるハルシネーションや一般化性の欠如といった RLVR の課題を解決し、頑健な政策最適化を実現する手法を提示しています。
この論文は、LLM の「真ん中の情報を見失う(Lost in the Middle)」現象が学習や位置符号化に起因するのではなく、残差接続を持つ因果的デコーダの幾何学的性質に由来し、初期化段階(トレーニング前)ですでに存在する構造的な偏りであることを、厳密な理論と実験的検証によって明らかにしたものである。
本論文は、従来の反応的な VLA モデルが抱える時制の不一致や文脈の欠如を解決するため、独自の長期記憶を維持して連続的な動作を生成する「AR-VLA」と呼ばれる新しい自己回帰型アクション専門モジュールを提案し、より滑らかで文脈に敏感なロボット制御を実現する手法を提示しています。
この論文は、ドメイン専門家の手作業に依存していたデータ製品の改善を、質問の提示や多面的な品質指標の監視、そして人間の介入を可能にする制御機能を備えた専門 AI エージェントによる継続的最適化ループを通じて自動化するシステムを提案しています。
この論文は、形式言語理論における生成と認識の間の本質的な非対称性を、計算複雑性や曖昧さなど新たに特定された 6 つの次元から包括的に分析し、両者が拡張的には等価であるにもかかわらず操作的にどのように異なるかを明らかにしています。
この論文は、大規模な X(旧 Twitter)ネットワークから学習した社会的埋め込み空間を用いて、ユーザーの好みをドメイン横断的に表現・予測する手法を提案し、ターゲット領域にフィードバックデータが存在しないゼロショット設定でも、人気ベースの基準を上回る効果的なパーソナライゼーションを実現できることを実証しています。
この論文は、過去の学習チェックポイントをモデルマージ技術で統合して新しいタスクのファインチューニング初期値として活用する「Mashup Learning」を提案し、これにより下流タスクの精度向上と収束の高速化を実現することを示しています。
この論文は、AI エージェントと外部ツールを接続する新しい標準「MCP」において、互換性確保のための緩い仕様制約が新たな脆弱性を生んでいることを指摘し、多言語 SDK を横断的に分析・攻撃する包括的なフレームワークを初めて提案するものである。
本論文は、大規模言語モデルエージェントのツール連携を可能にするオープンソースのMCP(Model Context Protocol)サーバーのセキュリティリスクを体系的に評価するフレームワークを提案し、静的コード分析を用いて脆弱性を特定し、現実的な攻撃パターンと照合して多面的なリスクスコアリングを行うことで、安全な設計の必要性を浮き彫りにしています。
この論文は、大規模言語モデルの幻覚を信号処理の適応ノイズキャンセレーションに例え、推論時に特定の神経活性化をリアルタイムで抑制する「適応的活性化キャンセル(AAC)」という手法を提案し、事実性の向上を達成しながらもモデルの汎用能力や流暢さを一切損なわないことを示しています。
本論文は、拡散モデルにおける複雑な複数インスタンス生成時の概念欠落問題を解決するため、ビジョン・言語モデルから抽出した欠落概念のセマンティックな差分キー()を共有クロスアテンションのキー空間に注入し、追加学習や空間マスクなしで構成整合性を向上させる「Delta-K」というプラグアンドプレイ推論フレームワークを提案するものです。
本論文は、多言語学習(特にインド語データ)とチャットボット生成データ、およびJaro類似度に基づくマッチング手法を組み合わせることで、従来のPassGANや辞書照合を超えた高精度なパスワード強度推定システムを構築し、言語に特化したセキュリティ対策の新たな可能性を示した研究です。
本論文は、確率的バンディット問題における方策勾配法の連続時間拡散近似を解析し、学習率の条件に応じて対数後悔と線形後悔が分岐することを示しています。
この論文は、呼吸や手術操作による軟部組織の変形をリアルタイムで追跡し、放射線被曝を伴わずに静的な CBCT 画像を動的に更新するための、ロボット超音波と変形認識型深層学習を組み合わせた新しいフレームワークを提案しています。
この論文は、従来のクロスエントロピー損失の課題を克服するため、視覚モデルや大規模言語モデルにおいて多様な距離指標(特にコサイン距離)を用いた拡張ハーモニック損失を体系的に評価し、精度、解釈性、持続可能性の観点からその有効性を示したものです。
この論文は、レイトレーシングデータを用いて最適化された量子回路を備えた量子センサーが、従来の古典的な手法よりも少ない情報量で環境を学習し、チャネル測定を不要としながら微弱な電波信号にも敏感に反応する局所化タスクを可能にすることを示しています。
この論文は、偏微分方程式を解くためのスパイク型ニューロモルフィックアルゴリズムが、最大 32% のニューロン欠損や 90% のスパイク欠落に対しても精度を維持する構造的な頑健性と耐故障性を有し、その耐性が構造的ハイパーパラメータによって調整可能であることを実証しています。
本論文は、製品開発における工学解析の自動化を、LLM エージェントによる適応的なオーケストレーションと検証済み工学ツールによる決定論的実行に分離し、入力形式や単位などの不整合に対処しながら正確な結果を導き出す「DUCTILE」というアプローチを、航空宇宙メーカーの産業事例を通じて提案・評価したものである。
この論文は、脳画像の全体構造と関心領域(ROI)グラフの局所構造を双方向の対照学習で統合的に学習するフレームワークを提案し、ADHD-200 や ABIDE データセットにおける脳疾患分類の精度向上と、両者の補完的な判別パターンの可視化を実証しています。