Continual uncertainty learning
この論文は、複数の不確実性を段階的に学習するカリキュラム学習フレームワークとモデルベース制御を組み合わせた新たな手法を提案し、自動車パワートレインの能動振動制御における非線形動特性や変動に対する頑健な制御とシミュレーションから実機への転移を実現したことを示しています。
2385 件の論文
この論文は、複数の不確実性を段階的に学習するカリキュラム学習フレームワークとモデルベース制御を組み合わせた新たな手法を提案し、自動車パワートレインの能動振動制御における非線形動特性や変動に対する頑健な制御とシミュレーションから実機への転移を実現したことを示しています。
従来の回折光学ニューラルネットワークの限界を克服するため、GLU に着想を得た再構成可能な自己変調非線形性と再帰的アーキテクチャを統合し、極めて低い電力消費で高精度な光学計算を実現する「ReDON」と呼ばれる新しい光学ニューラルプロセッサが提案されています。
この論文は、多領域の安全制約を含む PDDL3 ベンチマークの構築と、形式検証に基づく報酬機械を用いた GRPO による二段階ポストトレーニングを導入することで、タスク計画の安全性と未知の安全特性への汎化能力を大幅に向上させた「SafeGen-LLM」を提案し、既存の最先端モデルを上回る性能を実証したものである。
本論文は、拡散言語モデルが抱える「因数分解の壁」を、Transformer の出力分布を完全な因数分解から軽量な確率的推論層へ置き換える「結合離散拡散(CoDD)」というハイブリッド枠組みによって打破し、低コストかつ低遅延で高品質な並列生成を実現することを提案しています。
本論文は、sparse 教師ありセグメンテーション、知識に基づく制約推論、多基準意思決定分析という 3 つの手法を統合したニューロ記号フレームワーク「OrthoAI」を提案し、マウスピース矯正における 3D 歯のセグメンテーションと生体力学的妥当性の推論を自動化するものである。
この論文は、Grounding DINO 1.5 と YOLOv11 を検出器として、Segment Anything Model 2.1(SAM 2.1)を共有バックボーンに用いた二重パイプライン手法を提案し、鳥の画像セグメンテーションにおいてゼロショットおよび教師あり学習の両方で従来の手法を上回る性能を達成したことを報告しています。
この論文は、トレーニング時に特権的な 4 次元情報(3D 点の軌跡予測)を活用して VLA モデルに物理的な世界動態の理解を付与する「Pri4R」を提案し、推論時のオーバーヘッドなしにロボット操作タスクの性能を大幅に向上させることを示しています。
本論文は、LLM の推論能力の向上に伴い、従来の木探索よりも効率的な勾配ベースの最適化パラダイムを採用した MLE エージェント「Gome」を提案し、MLE-Bench で最先端の性能を達成するとともに、モデルの推論能力が高まるにつれて勾配ベースのアプローチが木探索を上回ることを実証しています。
この論文は、疎な報酬環境や欺瞞的なシナリオにおいて従来の分散モンテカルロ木探索(Dec-MCTS)よりも優れた性能を発揮するよう、確率的なボルツマン方策と減衰エントロピーボーナスを導入した協調ボルツマン MCTS(CB-MCTS)を提案し、その有効性をシミュレーションで実証したものである。
この論文は、企業の文書から文脈を抽出し、LLM を活用してニュースをマクロ・セクター・関連企業・対象企業の 4 段階に分類する意味ベースの多段階ペアリング手法を提案し、これにより従来のキーワードマッチングでは捉えきれなかった複雑な市場依存関係を反映した高品質な金融テキスト対時系列データセット「FinTexTS」を構築し、株価予測の精度向上を実証したものである。
この論文は、近隣ロボット間の空間的距離を明示的に組み込んだ新しい通信メカニズム「RMHA」を提案し、高密度環境における分散型多ロボット経路計画の成功率を大幅に向上させることを示しています。
この論文は、ハードウェア変更を伴わずにオーバーフロー感知スケーリングとマクロブロックスケーリングという 2 つのソフトウェア技術を導入することで、MXFP4 の量子化精度を大幅に向上させ、NVIDIA の NVFP4 との精度差を約 10% から 1% 未満に縮小し、MXFP4 を実用的な代替手段として再確立したことを示しています。
この論文は、219 語の要件定義書から自律的に動作し、1.48GHz で動作する RISC-V CPU「VerCore」の RTL 設計から GDSII レイアウトファイルまでの半導体製造を 12 時間で完了させた自律エージェント「Design Conductor」の成果を報告するものです。
本論文は、大規模言語モデル(LLM)がハードウェア設計の機能性を維持しつつ電力・性能・面積(PPA)を改善するリポジトリレベルの RTL 進化を評価するためのベンチマーク「CktEvo」と、ツールチェーンからのフィードバックを用いた自動改善フレームワークを提案し、実用的な設計最適化への道筋を示すものである。
この論文は、コストやプライバシーの懸念を回避しつつ機能的な正確性を高めるため、テストベンチ駆動の検証とデバッグ推論を組み合わせたマルチエージェントフレームワーク「SiliconMind-V1」を提案し、ローカルで微調整された大規模言語モデルが RTL 設計を反復的に生成・検証・修正できることを示しています。
本論文は、リソース制約のある組込みシステム向けに、ターゲットプラットフォームへの実装なしに混合精度量子化ニューラルネットワークの推論における精度、レイテンシ、リソース消費のトレードオフを評価・分析できる設計空間推論分析フレームワーク「ALADIN」を提案し、RISC-V ベースの AI ワークロード専用プラットフォームのサイクル正確なシミュレータを用いた検証を通じてその有効性を示したものである。
この論文は、大規模言語モデルの集団的行動において、安全対策としてのアライメント技術そのものが、特に検閲が不可視であったり制約が複雑であったりする場合に、意図しない集団的病理(iatrogenic harm)を誘発する可能性を示唆する予備的証拠を提示しています。
この論文は、深層学習ハードウェアアクセラレータの信頼性評価と強化のための新規かつ低コストな手法(包括的な文献レビューに基づく分析ツール、信頼性・量子化・近似のトレードオフ最適化、ゼロオーバーヘッドの AdAM 技術など)を提案し、学術界および産業界に多大な貢献をした博士論文の成果を要約しています。
本論文は、LLM の長文脈推論における KV キャッシュのメモリ制約を解決するため、再学習やアーキテクチャ変更なしで、レイヤごとの注意動力学とトークンの重要度に基づき動的に精度レベルを割り当てる適応型フレームワーク「ARKV」を提案し、メモリ使用量を 4 分の 1 に削減しながら基線モデルの精度を約 97% 維持することを示しています。
本論文は、超伝導およびイオントラップ方式の量子プロセッサにおけるシミュレーションと実機評価を通じて、測定を伴わない「ブラインド・リセット」手法が、論理サイクルのレイテンシを最大 38 倍削減しつつ、十分なアンシラ清浄度を維持して誤り訂正の効率化を実現できることを示しています。