LiDAR Remote Sensing Meets Weak Supervision: Concepts, Methods, and Perspectives
本論文は、ラベル付けコストと労力の課題を克服し、LiDAR 遠隔 sensing のデータ解釈とパラメータ推定を統一的な弱教師あり学習の枠組みで包括的にレビューし、今後の基盤モデルとの融合や汎化能力の向上に向けた展望を提示するものである。
3447 件の論文
本論文は、ラベル付けコストと労力の課題を克服し、LiDAR 遠隔 sensing のデータ解釈とパラメータ推定を統一的な弱教師あり学習の枠組みで包括的にレビューし、今後の基盤モデルとの融合や汎化能力の向上に向けた展望を提示するものである。
本論文は、CaMPL における高次プロセスのセマンティクスを動機として、非閉かつ非対称なモノイダル基盤においても「右作用圏(右 actegory)」と「コパワを持つ右 enriched 圏」が同値であることを証明したものである。
既存の異常検出ベンチマークの性能飽和とモデル比較の困難さを解決するため、透明・重なり物体や極小欠陥など 8 つの高度な産業検査シナリオを含む 8000 枚以上の高解像度画像からなる「MVTec AD 2」データセットと、その評価サーバーが提案されました。
本論文は、拡散モデルと教師 - 学生協調学習を組み合わせた新たな半教師あり学習フレームワークを提案し、限られたアノテーションデータでも最先端の性能を発揮する生体医学画像セグメンテーション手法を確立したものである。
この論文は、既存のデータセットが見過ごしていた広範なシーン編集を含む大規模な局所偽造画像データセット「BR-Gen」と、ノイズ指紋を用いて偽造痕跡を画像全体に伝播させることで検出性能を向上させる「NFA-ViT」という新しいモデルを提案し、AI 生成画像の局所偽造検出における新たな基準を確立したことを示しています。
Facebook 研究チームが開発したオープンソースライブラリ「SPDL」は、Python の GIL(グローバルインタプリタロック)を回避する仕組みにより、PyTorch の DataLoader と比較して ImageNet データセットの反復速度を 74% 向上させながら CPU 使用量とメモリ使用量を大幅に削減し、Free-Threaded Python 環境ではさらに 33% の性能向上を実現する、GPU 向けに最適化されたスケーラブルかつ高性能なデータ読み込みフレームワークです。
本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。
この論文は、光学画像と SAR 画像の融合による物体検出の性能向上を可能にする大規模な統合データセット「M4-SAR」と、その評価基準および新しい検出フレームワーク「E2E-OSDet」を提案し、複雑な環境下での検出精度を大幅に改善することを示しています。
この論文は、離散化による情報損失を回避し、身体部位間の相互感知を考慮した連続表現に基づく新しいフレームワーク「MARRS」を提案し、他者の動作に応じた協調的で微細な反応動作の生成を実現するものです。
この論文は、Diffusion Transformer を基盤とし、文字位置エンコーディングや位置エンコーディング補間などの新技術、さらに大規模な多言語合成データセットを活用することで、高精度かつ制御可能な多言語テキスト描画を実現する「EasyText」というフレームワークを提案するものである。
この論文は、7 つのプログラミング言語にまたがる 3 万枚以上のパッチを用いた大規模な実証研究を通じて、指示微調整と少数ショットプロンプティングを適用した GPT-4o が、従来の事前学習言語モデル(PLM)を上回る多言語・多粒度(関数レベルおよび行レベル)の脆弱性検出能力を有することを明らかにしています。
本論文は、生物学的なシナプスフィルタリング機構に着想を得たクロススケールゲーティング符号化(CSGC)と軽量残差ブロックを導入し、低消費電力かつ高精度な単眼 3 次元物体検出を実現するスパイクニューラルネットワーク「SpikeSMOKE」を提案するものである。
本論文は、最大次数と耐故障数を用いた故障耐性総支配数問題に対する$1 + \ln(\Delta + m - 1)$近似アルゴリズムの構築、および重み付き部分正影響支配集合問題の単純・総・連結版に対する対数近似アルゴリズムの提案(特に連結版では整数値から分数値への一般近似枠組みの拡張を含む)を報告するものである。
この論文は、オーストリアの新聞『デア・シュタント』の 10 年間(2013-2022 年)にわたる 7500 万件以上のコメントと 4 億件以上の投票を含む大規模な縦断データセットを提示し、ユーザーの匿名性を保ちつつドイツ語のオンライン議論の動態やネットワーク構造、意味分析を可能にする前計算済みベクトル表現を公開している。
この論文は、PyPI の 37 万 8,573 個のパッケージを対象とした定量分析を通じて、Python ソフトウェアサプライチェーンにおける依存関係の脆弱性の実態を明らかにし、そのセキュリティリスクに対する意識向上を促す「PyPitfall」という研究を紹介しています。
この論文は、物理場データ(流体力学など)の解釈を強化するため、物理的特徴を構造化されたテキストに変換する手法とデータ圧縮戦略を組み合わせた新しい大規模視覚言語モデル「FieldLVLM」を提案し、既存手法を上回る性能を実証したものです。
本論文は、バルク領域でのストークス流と表面でのビオト・キルヒホフ方程式に基づく多孔質弾性プレートが結合した 3 次元 -2 次元モデルの解析と、安定した仮想要素法による離散化、収束性の証明、およびシリコンナノポーア膜を用いた免疫隔離シミュレーションへの応用を提案するものである。
本論文は、不確実な嵌合タイプと嵌合量を有するバッチ精密組立タスクに対し、力・視覚融合制御駆動のマルチタスク強化学習と教師政策蒸留を用いて、複数のサブタスクに対応する堅牢でコンプライアンス性の高い統合制御戦略を構築する手法を提案し、実機実験で高い成功率と力制御性能を実証している。
この論文は、グラフに基づく決定性多項式時間アルゴリズムと、局所的な非実行可能性の剪定による大域的整合性の維持という手法を用いて、NP 問題を決定性多項式時間で決定可能であると主張し、P=NP の証明を提示するものである。
この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。