PLANING: A Loosely Coupled Triangle-Gaussian Framework for Streaming 3D Reconstruction
PLANING は、明示的な幾何プリミティブとニューラルガウスを緩く結合したハイブリッド表現を採用することで、高品質なレンダリングと正確な幾何形状の両立を実現し、リアルタイムなストリーミング 3 次元復元を可能にする効率的なフレームワークです。
5139 件の論文
PLANING は、明示的な幾何プリミティブとニューラルガウスを緩く結合したハイブリッド表現を採用することで、高品質なレンダリングと正確な幾何形状の両立を実現し、リアルタイムなストリーミング 3 次元復元を可能にする効率的なフレームワークです。
本論文は、オンラインレビューの評価順序(評価先かレビュー先か)が、サービス品質や製品属性に応じて消費者評価の極端化を促進し、そのメカニズムが感情的ヒューリスティックと認知的努力の直列的媒介を通じて生じることを、3 つの実験と Yelp などの大規模二次データ分析により実証したものである。
本論文は、参照画像と修正テキストから「メンタルイメージ」を直接生成し、データベースの画像にも対応する合成画像を構築して両者をマッチングさせることで、学習不要かつゼロショットで構成画像検索の最先端性能を達成する「Paracosm」という手法を提案しています。
KVSmooth は、アテンションエントロピーに基づく適応的平滑化を KV キャッシュに適用することで、追加の学習なしにマルチモーダル大規模言語モデルの視覚的ハルシネーションを効果的に軽減し、精度と再現率を同時に向上させる推論時のプラグアンドプレイ手法です。
本論文は、ロボット工学における「退屈・汚い・危険(DDD)」な作業という概念の歴史的・実証的検討を通じて、その明確な定義や具体例の欠如を指摘し、社会科学の知見を踏まえた新たな枠組みを提案することで、ロボット技術が人間の労働に与える影響をより深く理解する道筋を示しています。
本論文は、LLM ワークフローを「LLM プログラム」として抽象化し、KV キャッシュのヒット率向上やメモリ不均衡の解消、非同期な環境準備を可能にするプログラム意識型のスケジューラとツールリソースマネージャーを備えた高速でシンプルな推論システム「ThunderAgent」を提案し、既存システムと比較してスループットやディスクメモリ効率を大幅に改善することを示しています。
OmniVTON++ は、特定のデータ条件に依存せず再学習が不要なトレーニングフリーの汎用仮想試着フレームワークであり、構造化された衣類変形、主姿勢ガイダンス、連続境界縫合を統合することで、単一または複数の人物・衣類、さらにはアニメキャラクターに至るまで、多様な状況と拡散モデルにおいて最先端の性能を実現します。
本論文は、医療画像のアクティブラーニングにおいて、ゼロショット推論を行うビジョン・ランゲージモデルの過信を解消し、解釈性とラベル効率を向上させるため、テキスト - 画像の類似性を証拠として再解釈し、ディリクレ分布を用いて欠如と矛盾を定量化する「Similarity-as-Evidence(SaE)」フレームワークを提案し、10 の公開データセットで最先端の性能を達成したことを示しています。
この論文は、画像から導出された領域における PDE 離散化の安定性と並列性を向上させるため、境界と交差する三角形のみを局所的に再三角化し、決定論的なシンボル検索テーブルを用いてスリバー要素を抑制するテンプレート駆動型の構造化ビットマップからメッシュへの三角化フレームワークを提案するものである。
本論文は、筋骨格モデルに基づいて既存の姿勢データセットに解剖学的に整合した 3 次元脊椎キーポイントを生成する生体力学意識型シミュレーションフレームワークと、自然な全身運動における脊椎レベルの 3 次元注釈を備えた初のオープンデータセット「SIMSPINE」を提案し、コンピュータビジョンと生体力学の架け橋となる統一ベンチマークを確立するものである。
本論文は、グラフの構造的特徴を抽出するフレームワーク DRESS の拡張である-DRESS が、CFI 階梯定理により任意のに対して CFIペアを区別し、特定の構造的仮定の下で-WL 階層と同等以上の識別能力を持つことを理論的に証明したものである。
本論文は、CLIP などの VLM が最適化するモダリティ間距離との一貫性を欠く既存の OOD 検出手法の課題を解決するため、負のテキスト選択と視覚情報のテキスト空間への変換を通じてモダリティ間距離の一貫性を追求する新しいフレームワーク「InterNeg」を提案し、ImageNet や Near-OOD などの大規模ベンチマークで最先端の性能を達成したことを示しています。
この論文は、従来の CUDA コアだけでなく、現代の GPU で高性能を実現するテンソルコアに対しても近距離の物理的サイドチャネル攻撃を適用し、さらに 100cm 先の遠距離からでもガラス越しに LLM の重みやハイパーパラメータが漏洩する可能性を実証した Kraken と呼ばれる高次 EM サイドチャネル攻撃手法を提案するものです。
本論文は、コード分析タスクにおけるマルチタスク学習とパラメータ効率型微調整(PEFT)を統合した初の包括的評価を行い、単一の共有 PEFT モジュールがフル微調整に匹敵する性能を発揮しつつ、ストレージや計算コストを大幅に削減できることを示し、さらにタスクの組み合わせやモデル構造が成功に与える影響を明らかにした。
この論文は、OER(オープン教育リソース)の普及を阻む社会的・経済的・技術的な 26 の障壁を特定し、専門家へのインタビューと概念モデルの構築を通じて、教育コミュニティや政策立案者がこれらの障壁を克服し、包括的な教育エコシステムを構築するための示唆を提供しています。
本論文は、大規模な学習における専門的な自動化(フィードバック、評価、教育用チャットボットなど)をプラットフォームに依存せず実現するため、4 つの機関で実証された教育マイクロサービス向けの標準 API 仕様「Ed」を提案し、相互運用可能なエコシステムの構築を目指すものである。
本論文は、司法量刑支援における公平性を検証するため、LLM が「徳ある被害者効果」や「ハロー効果」などの認知バイアスを示すかを実証的に調査し、人間と比較してバイアスが軽減される傾向があるものの、モデル間のばらつきにより現状の司法利用には課題が残ることを明らかにしています。
この論文は、EU の AI 法に基づく一般目的 AI モデルのリスク評価において、規制当局が意図する目的に合致し、かつ提供者への過剰な負担を避けるために、科学的な手法を用いて「比例原則」を実践的に運用する可能性を論じています。
この論文は、大規模言語モデル(LLM)がユーザーの意見に与える影響を、民主的な審議プロセスに基づく規範的な基準「DeliberationBench」を用いて評価し、実験を通じてその影響が広範に認識論的に望ましい方向に働いていることを示しました。
この論文は、AI が神聖な存在として扱われる「GPTheology(大規模言語モデル神学)」という新たな技術宗教の台頭を、オンラインコミュニティの議論や世界各地の具体事例を通じて分析し、AI と宗教の交錯がもたらす哲学的・社会的・倫理的な課題を浮き彫りにしています。