Goldilocks Test Sets for Face Verification
既存の顔認証モデルが人工的な画像劣化なしでも直面する課題(属性差の大きい同一人物ペア、属性差の小さい異人物ペア、双子や親族など似顔人物)を特定し、高品質な画像を用いた「Goldilocks」レベルの新たなテストセット(Hadrian、Eclipse、ND-Twins)を提案する論文です。
8464 件の論文
既存の顔認証モデルが人工的な画像劣化なしでも直面する課題(属性差の大きい同一人物ペア、属性差の小さい異人物ペア、双子や親族など似顔人物)を特定し、高品質な画像を用いた「Goldilocks」レベルの新たなテストセット(Hadrian、Eclipse、ND-Twins)を提案する論文です。
この論文は、従来の拡散モデルが抱える計算コストや系列長の制限を克服し、正規化フローを用いて再帰的な条件付けを確率的に実現することで、長系列の人間運動を高精度かつ効率的に生成する新しい「RDM(再帰的拡散モデル)」を提案するものです。
この論文は、転移エントロピーを用いてエージェント間の影響力を報酬に組み込むことで、人間の意図や事前知識に依存せず、協働や競争のシナリオにおけるロボットと人間の間の暗黙的コミュニケーションを促進する手法を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。
本論文は、特定の固定パラメータ易解性要件を満たす一階理論の固定否定数フラグメントが多項式時間で決定可能であるための一般的な枠組みを提示し、弱プレスバーガー算術や弱線形実数算術などの具体例において、Nguyen と Pak による Presburger 算術の制限されたフラグメントの NP 困難性とは対照的に多項式時間決定可能性を証明している。
本論文は、コード品質の向上とレビュー担当者の専門性及び業務負荷を考慮したリファクタリング提案を行うための多目的探索手法「MORCoRA」を提案し、その有効性を複数のオープンソースリポジトリを用いて実証したものである。
この論文は、28nm CMOS 技術を用いて 1.6fJ/spike の超低消費電力を実現したアナログスパイキングニューロンを設計・実装し、MNIST 認識タスクにおいて 82.5% の精度を達成した埋め込み機械学習向けの高効率ニューロモルフィック SoC の実現可能性を示したものである。
この混合研究法による比較プロジェクトは、ウィキペディアにおけるタブー知識の生成と維持の過程を分析し、その発展における 6 つのテーマを特定するとともに、限定的な識別性と断片的な意味付けという条件下でタブー記事が存続するために必要なレジリエントなリーダーシップや組織的関与、そして参加者のガバナンスと公衆の想像力について明らかにした。
本論文は、音声と動画データを統合して喉頭動画から重要なセグメントを抽出し、拡散モデルによる精緻化や角度偏差測定を用いて声帯麻痺の検出精度を向上させた支援診断システム「MLVAS」を提案し、その有効性を実証したものである。
この論文は、AI を活用したテストケース生成と検証が、従来のソフトウェアテストが抱える課題を解決し、効率性・精度・拡張性を飛躍的に向上させる可能性と、その実装における課題や実用例について考察している。
この論文は、深層強化学習で学習した歩行ポリシーの低周波動的を高次元空間で線形化するコップマン演算子に基づくモデル予測制御を提案し、複雑な非線形挙動を示す二足歩行ロボットの安全なナビゲーションと狭い通路を有する密集環境での成功率向上を実現することを示しています。
本論文は、患者・医師・家族の多角的な相互作用を可能にし、検索拡張生成(RAG)と思考連鎖(CoT)技術を活用して大規模言語モデルの幻覚を抑制し、解釈可能性と診断精度を向上させたうつ病評価システム「InterMind」を提案するものである。
CLIP などの事前学習済み基盤モデルを活用してオンラインで視覚的プロンプトを自動生成・更新し、対照的なガイダンスを通じて不要な対象を抑制することで汎用オブジェクトトラッキングの性能を向上させる新しい手法「PiVOT」を提案する論文です。
分散型ルーティング設定の自動診断と修復を可能にする新システム「S^2Sim」は、設定のバリエーションを選択的に記号的にシミュレーションすることで意図に合致する修正版を特定し、その差分からエラーを特定してパッチを提案する。
本論文は、人間の注釈を必要とせず画像から物体カテゴリの一般的な姿勢事前分布を学習する「Pose Prior Learner」を提案し、その階層的メモリと反復推論によって、特に遮蔽された画像における姿勢推定の精度を向上させることを示しています。
この論文は、音声とテキストの情報を同期させて拡散モデルを用いることで、感情や移動を含む表現豊かな全身ジェスチャーを生成する新しいフレームワーク「ExpGest」を提案し、既存の手法よりも自然で制御性の高い結果を実現したことを示しています。
この論文は、バイヤーの評価がセラーの私的情報に依存する双方向取引において、仲介者が収益を最大化するための最適メカニズムを分析し、インセンティブ整合性・服従性・情報提供の同時達成が不可能であることを示した上で、セラーの費用が一定の場合や仲介者が拒否権を持つ場合の最適メカニズムがそれぞれ異なる閾値構造を持つことを明らかにしている。
本論文は、従来の赤青ペブルゲームの制約を緩和し部分計算を可能にする新たなモデルを提案し、その最適戦略の決定問題が単一レベルの DAG や極めて限られたメモリサイズの場合でも NP 完全であることを示すとともに、特殊ケースに対する近似アルゴリズムを概説しています。
この論文は、k-SAT や MAX-3-SAT などの問題に対する一様非決定性時間の下界仮定を用いて、高回路サイズを持つ単調ブール関数、高剛性を持つ行列、および高ランクを持つテンソルを構成する方法を示し、これらを通じて回路サイズの下限証明を導出する「勝敗なし(win-win)」の結果を確立するものである。
本論文は、TikTok と Spotify の異なるプラットフォーム化の慣行がヒット曲の特性に与える影響を比較計算分析し、両プラットフォーム間の相互連関性を明らかにしたものである。
この論文は、競合相手の状態や行動を直接知らずに学習するコンテキストフリーのマルチアームバンディットアルゴリズムが、行動の同期性によって「単純な共謀(naive collusion)」を学習する現象を解明し、その発生が使用されるアルゴリズムの確率的・決定論的特性に依存することを示しています。