cs.CV 件の論文 | Gist.Science

OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

本論文は、ステージングデータ、合成データ、実世界の事故動画という 3 つのドメインを統合し、プライバシーに配慮しつつ実環境での転送性能を評価できる包括的なフォール検出ベンチマーク「OmniFall」を提案し、合成データが実ステージングデータを凌駕する可能性を示しています。

David Schneider, Zdravko Marinov, Zeyun Zhong + 5 more2026-03-02💻 cs

Cora: Correspondence-aware image editing using few step diffusion

本論文は、拡散モデルを用いた画像編集において、構造的な変化や非剛体変形を伴う編集でもアーティファクトを抑制し、ソース画像の構造やテクスチャを正確に維持しながら高品質な結果を得るために、対応関係に基づくノイズ補正と補間アテンションマップを導入した新しいフレームワーク「Cora」を提案するものである。

Amirhossein Alimohammadi, Aryan Mikaeili, Sauradip Nag + 3 more2026-03-02💻 cs

ECAM: A Contrastive Learning Approach to Avoid Environmental Collision in Trajectory Forecasting

本論文は、既存の歩行者軌道予測モデルに環境との衝突を回避する能力を付与し、ETH/UCY データセットでの実験により衝突発生率を大幅に低減したコントラスト学習ベースのモジュール「ECAM」を提案するものである。

Giacomo Rosin, Muhammad Rameez Ur Rahman, Sebastiano Vascon2026-03-02💻 cs

LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation

この論文は、大規模言語モデル（LLM）の知識を活用してテキスト情報を強化し、CLIP による画像・テキスト埋め込みの融合と多重アテンション機構を組み合わせることで、クロスドメイン逐次推薦の精度を大幅に向上させる新しい手法「LLM-EMF」を提案し、複数の電子商取引データセットでの実験によりその有効性を実証したものです。

Wangyu Wu, Zhenhong Chen, Wenqiao Zhang + 5 more2026-03-02💻 cs

Distilling Balanced Knowledge from a Biased Teacher

この論文は、教師モデルのバイアスに起因する長尾分布における知識蒸留の課題を解決するため、予測分布の誤差をグループ間・グループ内で分解し、再重み付けされた損失関数を用いてバランスの取れた知識を抽出する新しいフレームワーク「LTKD」を提案し、複数のデータセットで既存手法を上回る性能を実証しています。

Seonghak Kim2026-03-02💻 cs

Empowering Small VLMs to Think with Dynamic Memorization and Exploration

この論文は、SFT と RLVR のトレードオフを動的に調整する「DyME」という新たな学習パラダイムと視覚的監視メカニズムを提案し、小規模な視覚言語モデル（SVLM）に安定した推論能力を付与することで、専門分野における性能を大幅に向上させることを示しています。

Jiazhen Liu, Yuchuan Deng, Long Chen2026-03-02💻 cs

SelvaBox: A high-resolution dataset for tropical tree crown detection

本論文は、熱帯林の樹冠検出を目的とした、3 カ国にまたがり 8 万 3 千以上の手動ラベル付き高解像度ドローン画像を含む「SelvaBox」という大規模オープンデータセットを公開し、高解像度入力が検出精度の向上に寄与することや、本データセットで学習したモデルが他データセットにおいても優れた汎化性能を示すことを実証しています。

Hugo Baudchon, Arthur Ouaknine, Martin Weiss + 5 more2026-03-02💻 cs

Concept-based Adversarial Attack: a Probabilistic Perspective

この論文は、単一画像の摂動ではなく概念の分布を操作する確率的アプローチを採用することで、元の概念を保持しつつ多様で効率的な敵対的サンプルを生成する新たな攻撃フレームワークを提案しています。

Andi Zhang, Xuan Ding, Steven McDonagh + 1 more2026-03-02🤖 cs.AI

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

この論文は、気象分野でまだあまり利用されていない説明可能なブースティングマシン（EBM）を用いて、知識に基づく機械学習アプローチにより衛星画像からオーバーシュート・トップを特定する解釈可能なモデルを開発し、人間の専門家の戦略と機械学習を融合させた手法を提案しています。

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG

pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models

本論文は、分散・異質なデータ環境において視覚言語モデルを効率的に適応させるため、モダリティ固有の層と共有投影層を備えたマルチモーダルアダプターを導入し、個人化と汎化性能の両立を達成する新しいパーソナライズド連合学習フレームワーク「pFedMMA」を提案するものである。

Sajjad Ghiasvand, Mahnoosh Alizadeh, Ramtin Pedarsani2026-03-02🤖 cs.LG

Conformal Prediction for Long-Tailed Classification

この論文は、長尾分布を持つ分類タスクにおいて、既存のコンフォーマル予測法が抱える「予測セットのサイズ」と「クラス条件付きカバレッジ」のトレードオフを解消し、マクロカバレッジを最適化する新しいスコア関数と補間手法を提案し、大規模な植物画像データセットでその有効性を示したものである。

Tiffany Ding, Jean-Baptiste Fermanian, Joseph Salmon2026-03-02📊 stat

Animal behavioral analysis and neural encoding with transformer-based self-supervised pretraining

この論文は、ラベル付きデータが不足している状況でも多様な神経行動分析を可能にするため、マスク付き自己符号化と時間的対照学習を組み合わせて未ラベル動画データから実験固有のビジョントランスフォーマーを事前学習する新しいフレームワーク「BEAST」を提案し、その有効性を複数の種およびタスクで実証したものである。

Yanchen Wang, Han Yu, Ari Blau + 5 more2026-03-02🧬 q-bio

Fast Learning of Non-Cooperative Spacecraft 3D Models through Primitive Initialization

この論文は、単一画像からプリミティブを推定する CNN 初期化器とノイズのある姿勢推定に対応するパイプラインを導入することで、宇宙環境における高精度な 3D 物体モデルの学習を、必要な画像数と計算コストを大幅に削減しながら実現する手法を提案しています。

Pol Francesch Huc, Emily Bates, Simone D'Amico2026-03-02🤖 cs.LG

DA-Occ: Direction-Aware 2D Convolution for Efficient and Geometry-Preserving 3D Occupancy Prediction in Autonomous Driving

本論文は、自律走行における 3D 空間占有予測の精度と効率性を両立させるため、Lift-Splat-Shoot パラダイムを基盤とし、垂直方向の幾何学的情報を明示的に符号化する高さスコア投影と方向認識型畳み込みを導入した「DA-Occ」という純粋な 2D フレームワークを提案し、nuScenes データセットで高精度かつリアルタイム推論を実現したことを述べています。

Yuchen Zhou, Yan Luo, Xiaogang Wang + 3 more2026-03-02💻 cs

← 前へ次へ →

cs.CV