Bilevel Layer-Positioning LoRA for Real Image Dehazing
本論文は、CLIP のクロスモーダル能力を活用した「ハゼからクリアへのテキスト指向損失」と、LoRA パラメータと注入層を同時に学習する「バイレベル層位置決め LoRA(BiLaLoRA)」戦略を提案し、ラベルなしデータを用いた実画像の除霧性能を大幅に向上させる手法を提示しています。
3447 件の論文
本論文は、CLIP のクロスモーダル能力を活用した「ハゼからクリアへのテキスト指向損失」と、LoRA パラメータと注入層を同時に学習する「バイレベル層位置決め LoRA(BiLaLoRA)」戦略を提案し、ラベルなしデータを用いた実画像の除霧性能を大幅に向上させる手法を提示しています。
この論文は、強化学習とモデル予測制御を階層的に結合したアーキテクチャを提案し、シミュレーションから実機(120kg の Centauro ロボット)へのドメインランダム化なしのゼロショット転送を成功させ、平坦および非平坦な地形における歩行・ハイブリッド移動の制御を実現したことを示しています。
この論文は、生音データを保存せずにウェアラブル機器を用いてリアルタイムで医療従事者の自然なコミュニケーション行動を分析するシステム「VoxCare」を提案し、そのデータから業務負荷やストレスを推測可能な行動指標を導き出すことで、医療提供の改善に貢献する手法を示しています。
本論文は、スパースな入力点群を拡散モデルで高品質な画像に修復し、ランダムサンプリングドロップと重み付き勾配を用いた再構築戦略により、最小限の入力画像から高品質で 3 次元整合性の高い 3D ガウススプラッティング(3DGS)を生成する「S2D」と呼ばれる新規パイプラインを提案するものである。
本論文は、DNS プロトコルの制約によって定義される有界な意味領域を形式化し、権威 DNS の応答選択メカニズムの表現力を条件付制限と有限候補集合の選択という正規形に還元することで、異種システム間の等価性や表現可能性をプロトコル意味論に基づいて厳密に推論する枠組みを提示しています。
この論文は、分散学習環境における畳み込みニューラルネットワーク(CNN)のアーキテクチャがモデル精度に与える影響と、計算効率を左右する要因を分析し、リソース集約的なシナリオにおける CNN の展開最適化に寄与する知見を提供するものである。
この論文は、事前学習済みモデルを凍結したまま、混合音声と過去の推定値を補間して候補を生成し、侵入型または非侵入型の指標を最適化することで反復的に改善を行う、教師なしの多段階推論手法を提案し、ターゲット話者抽出の精度向上と実用性を両立させることを示しています。
この論文は、口腔がん病変の検出において、シングルトン設計パターンとバッチ処理を採用した新アーキテクチャ「OC-RPAv2」が、標準的な RPA 法に比べて 60〜100 倍の効率向上と大幅な予測時間短縮を実現したことを示しています。
本論文は、視覚・言語・ロボット状態の情報を多モーダル潜在空間に圧縮保存する「マルチモーダル潜在リプレイ」とタスク埋め込みの進化を正則化する「インクリメンタル調整」を組み合わせた新しい生涯模倣学習フレームワークを提案し、LIBERO ベンチマークにおいて既存手法を大幅に上回る性能と忘却の抑制を実現したことを報告しています。
HyperLogLog スケッチを、そのランク分布の集中性を利用したハフマン符号化とバケット化により、合併性を維持しつつ ビットという最適空間に圧縮し、実用的な基数推定アルゴリズムとして機能する「Huffman-Bucket Sketch」を提案する論文です。
本研究は、大規模な高品質データセットと多段階評価フレームワークを用いて開発した口腔顎顔面 CBCT 報告生成システム「CBCTRepD」が、経験レベルを問わず放射線科医の報告品質を向上させ、見落としを減少させる実用的な AI 支援ツールであることを示しています。
本論文は、時相論理(LTLf)で記述された形式仕様に基づいて自律走行エージェントのテストシナリオを体系的に生成するフレームワーク「STADA」を提案し、既存手法と比較してより高いカバレッジを達成しつつシミュレーション回数を大幅に削減できることを示しています。
この論文は、2-CNF の最小非充足部分集合(MUS)の認識を線形時間で行う手法を提示し、欠陥 1 の MUS に関する既存の NP 完全性の結果を拡張するとともに、単項節を含む特定の MUS の発見が多項式時間で可能であることを示すことで、2-CNF の MUS における易解・難解な領域の理解を深めることを目指しています。
この論文は、動画の画質が分類精度に与える影響を考慮し、画質評価(VQA)と動画分類を相互に調整する自己教師あり学習ベースの「SSL-V3」モデルを提案し、医療用動画データセットなどでの高い分類精度を実証したものである。
プライバシー制約と通信コストの課題を解決するため、Med-DualLoRA はグローバル共有とローカル適応を分離するパラメータ効率型連合学習フレームワークを提案し、3D 心臓 MRI における疾患検出タスクで他の手法を上回る性能と効率性を達成しました。
本論文は、低照度画像の輝度と色情報の分離や分布の不一致という課題を解決するため、分散に基づくチャネル再較正(VCR)フレームワークを提案し、適応的調整と分布整合モジュールを通じて画質を向上させ、既存手法を上回る性能を達成したことを報告しています。
2024 年 9 月にピッツバーグで開催された「医療応用におけるアルゴリズムとハードウェアの共設計」に関する NSF ワークショップの報告書は、医療技術の次世代開発に向けた戦略的ロードマップを提示し、標準化されたデータ・計算基盤の整備、臨床ワークフローを考慮したシステムや人間と AI の協働枠組みの構築、客観的かつ継続的な評価に基づく検証エコシステムの推進、そして安全で責任ある仮想・物理的医療エコシステムの実現を提言しています。
本研究は、低レベルの直交インピーダンス制御と高レベルの強化学習エージェントを組み合わせ、異なる材料特性を持つ試料を自動で削り取る適応型力制御フレームワークを提案し、シミュレーションで学習した方策を実機へ転送して固定トルク手法よりも平均 10.9% 高い性能を達成したことを示しています。
本論文は、アテンションベースのマルチインスタンス学習を用いた自己教師あり学習により失敗モードを予測する軽量なクラスファイア「PPGuide」を提案し、事前学習済み拡散方策の推論時に性能予測勾配を適用することで、ロボティクスタスクにおける失敗を抑制し成功率を向上させる手法を提示しています。
この論文は、非一様確率に基づくポアソンサンプリングをアサイクリック結合に対して実行する際、大規模な結合結果を完全に物化することなく、ほぼインスタンス最適で実用的なアルゴリズムを提案し、従来のサンプリング手法やヤナカキスの結合処理アルゴリズムを凌駕する性能を実証するものである。