Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models
この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。
6121 件の論文
この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。
この論文は、Gap-ETH 下で最適であることが示された $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)}d(1+\varepsilon)$-近似解法として提示するものである。
この論文は、推薦エージェントが受動的な情報処理から自律的な調査へ移行できるよう、ユーザーやアイテム、協調的な情報の不足を動的に分析・補完し、専門ツールを自律的に活用して推論を行う「RecThinker」というフレームワークを提案し、その性能を実証したものです。
この論文は、低次元ユークリッド空間における-median および-means 問題の-近似アルゴリズムの実行時間を大幅に改善し、さらに Gap Exponential Time 仮説の下でその実行時間の下限がほぼ一致することを示しています。
本論文は、現実のアプリケーションで生じるモダリティの欠損率の偏りを考慮し、感情分析タスクにおけるモデルの公平性と最適化の偏りを評価するための新たなベンチマーク「MissBench」と、その診断指標(MEI と MLI)を提案するものです。
本論文は、従来の時間ベースの権限取り消しモデルがエージェント実行環境において抱える一貫性問題を、メモリ一貫性モデル(MESI)の概念を権限管理に転用した「能力一貫性システム(CCS)」と「リリース整合性指向一貫性(RCC)戦略」によって解決し、シミュレーションにより従来手法に比べ最大 184 倍の安全性向上と権限取り消し遅延に伴う不正操作の理論的限界の突破を実証しています。
本論文は、理解・推論・生成・編集を統合した軽量な 40 億パラメータのマルチモーダルモデル「InternVL-U」を提案し、大規模モデルを凌駕する性能と効率性のバランスを達成したことを報告しています。
この論文は、手首の関節座標と物体のバウンディングボックスというスパースな運動ガイダンス、物体ストレスアテンション機構、そしてマルチタスク補助学習戦略を組み合わせることで、物理的に整合性が高く制御可能な人間 - 物体相互作用(HOI)ビデオ生成を実現する「DISPLAY」というフレームワークを提案しています。
この論文は、GPS 非依存環境における 5 種類の協調局所化手法(CCL、DCL、StCL、CI、Standard-CL)を ROS 環境で比較評価し、StCL や Standard-CL は精度が高いもののフィルタの一貫性に問題があり、DCL は頑健性が高く、CI は精度と一貫性のバランスに優れているなど、各手法のトレードオフを明らかにしたものである。
TREC 2025 RAG トラックは、MS MARCO V2.1 コーパスを用い、複雑な推論を要する長文ナラティブクエリへの対応や、透明性・事実性のある回答生成を評価対象として、信頼性の高い検索拡張生成システムの開発を促進するものです。
本論文は、スポーツの空間的知能を評価する初の大規模データセット「CourtSI」とベンチマーク「CourtSI-Bench」を提案し、既存の視覚言語モデルの空間認識能力の限界を明らかにするとともに、CourtSI によるファインチューニングがモデルの精度向上と汎化性能の改善に寄与することを示しています。
本論文は、ゲーム理論モデルとシミュレーションを用いて、非協力的な環境における 802.11 の MAC プロトコル(DCF および 802.11e)がシステム全体のパフォーマンスを低下させる望ましくないナッシュ均衡をもたらすことを示し、チャネル資源の割り当てとノードの送信戦略を独立させることで、より高いスループットを実現する理想的な MAC プロトコルが可能であることを論じています。
この論文は、エンタープライズネットワークにおける接続パターンに基づいてホストを役割分類し、ネットワーク管理の効率化や侵入検知の精度向上に貢献する 2 つのアルゴリズムを提案し、実機環境での検証により、ホスト数を大幅に削減しつつ論理的なネットワーク構造を反映したグループ化が可能であることを示しています。
本論文は、大規模言語モデルの埋め込みと視覚誘導知識アダプタ、および硬い負例合成メカニズムを活用して、生成モデルに比べて推論遅延を約 100 倍削減しつつ、オープンドメイン視覚実体認識タスクで高い性能を達成する効率的な対照学習ベースライン「WikiCLIP」を提案するものです。
本論文は、点群再構成や生成における標準的な損失関数であるチャマファ距離の最適化が、局所的な正則化では解決できない勾配構造上の欠陥により「最適化しない場合よりも悪い結果」をもたらす「崩壊」を引き起こすことを示し、これを抑制するには局所領域を超えた非局所的な結合(グローバルな結合)が不可欠であることを明らかにした。
本論文は、データベースシステムが SSD の性能を最大限に引き出し寿命を延ばすために、B-tree ベースの LeanStore を再設計してアウト・オブ・プレイス書き込みを最適化し、トランザクションごとのフラッシュ書き込みを大幅に削減しながらスループットを向上させる手法を提案・評価したものである。
この論文は、関節角度に基づく擬似画像表現とトークン単位の遅延相互作用(MaxSim)を組み合わせることで、既存の手法が抱える細粒度対応の欠如や解釈性の低さを克服し、テキストと 3 次元人間の動きの間の高精度かつ解釈可能な検索を実現する手法を提案しています。
この論文は、注釈付きの CT データと注釈なしのインターベンショナル CBCT データを用いて、マージン・ディスパリティ・ディスクリパンシー(MDD)の最適化枠組みを再定式化した新しい教師なしドメイン適応フレームワークを提案し、肝臓セグメンテーションの性能を向上させることを示しています。
この論文は、遅延相互作用型検索モデルにおけるトークンプルーニングを埋め込み空間のボロノイ細胞推定問題として定式化し、幾何学的な原理に基づいてインデックスサイズを削減しつつ検索品質を維持する新たな枠組みを提案しています。
この論文では、専門家と非専門家の診断間の不一致に基づいて「スライドの難易度(WSD)」を定義し、それをマルチタスク学習や重み付き損失関数に組み込むことで、前立腺がんのグレアス分類における多实例学習(MIL)の性能、特に高悪性度のケースでの精度向上を実現する手法を提案しています。