Differentiable Variable Fonts
この論文は、可変フォントのパラメータとベクトルグラフィック間の微分可能な関係を確立する「微分可能可変フォント」を提案し、勾配法による最適化を通じて文字の形状操作、重なり考慮モデリング、物理ベースのアニメーション、および自動フォント設計など、直感的で自動化されたタイポグラフィワークフローを実現するものです。
8464 件の論文
この論文は、可変フォントのパラメータとベクトルグラフィック間の微分可能な関係を確立する「微分可能可変フォント」を提案し、勾配法による最適化を通じて文字の形状操作、重なり考慮モデリング、物理ベースのアニメーション、および自動フォント設計など、直感的で自動化されたタイポグラフィワークフローを実現するものです。
この論文は、制約の厳しい環境におけるモデルベース拡散法のサンプリング非効率性と性能劣化を、内部点法に着想を得た「出現バリア関数」を用いて段階的に制約を導入する手法(EB-MBD)により解決し、投影法に比べて計算コストを大幅に削減しつつ、2 次元および 3 次元の複雑なタスクで高品質な安全軌道最適化を実現することを提案しています。
本論文は、強化学習と自己ロールアウト機構を組み合わせることで、リアルタイムかつ高精度な運動制御を実現し、既存の拡散モデルに比べて大幅な遅延低減と高画質を両立する初の RL 強化型少量ステップ自己回帰動画生成モデル「AR-Drag」を提案するものである。
本論文は、事前学習された視覚言語モデルから得られるノイズの多い概念信号を補助的な再構成タスクを通じて活用し、視覚制御タスクにおける効率的な探索を可能にする「概念駆動型探索(CDE)」を提案し、シミュレーションおよび実世界のロボットアーム操作タスクでの有効性を示しています。
この論文は、Reddit の「Am I the Asshole」コミュニティの事例を用いて大規模言語モデル(LLM)間の議論を分析し、同期・ラウンドロビンといった対話プロトコルやモデルの種類によって、意見の修正率や価値観の優先順位、および順序効果への反応に顕著な差異が生じることを明らかにしています。
本論文は、マルチモーダル推論モデルにおける浅い層の知覚バイアスと深い層の推論ドリフトという二つの失敗モードを特定し、学習不要の軽量プラグイン「Functional Head Identification and Class-Conditioned Rescaling」を用いて層間での注意配分を適応的に再調整することで、再学習やアーキテクチャ変更なしに推論の一貫性と視覚的忠実度を向上させる手法を提案しています。
この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。
本論文は、視覚言語行動(VLA)モデルに対して、少量のデータ汚染と視覚トリガーを用いて、タスク性能を維持したまま特定の安全上重要な動作を強制的に実行させる「DropVLA」と呼ばれる、動作レベルのバックドア攻撃手法を提案し、その物理世界での有効性を検証したものである。
本論文は、オフラインデータセットで学習された潜在空間の世界モデルとモデル予測制御(MPC)を組み合わせ、人間のデモンストレーションなしで物理的接触を活用したヒューマノイドロボットのリアルタイムかつロバストな動作計画を実現するフレームワークを提案しています。
デジタルストレスの軽減を目的として他者に教える「プロテジェ効果」を適用した研究では、受動的・能動的な指導グループとも対照群との間に有意な差が見られず、認知的関与が行動変容に直結しない難しさが示されました。
本論文は、2018 年から 2025 年にかけて脳 MRI 画像の異常検出に応用された教師なし深生成モデルに関する 33 件の研究を体系的にレビューし、その潜在的可能性と方法論的な課題、そして今後の臨床的有用性を高めるための新たな方向性を明らかにしたものである。
本論文は、不完全な点群データから物体の安定性、把持性、干渉を統合的に評価する確率的な「配置可能性メトリック」を提案し、事前モデルに依存せずに未見の物体に対する堅牢な一貫した把持・配置計画を実現する手法を提示しています。
本論文は、音声と視覚の連続学習におけるモダリティの干渉を解決するため、マルチモーダルなサンプル選択と衝突に基づくリハーサル機構を組み合わせた新しいフレームワークを提案し、音声誘導型の連続オーディオ・ビジュアルセグメンテーションタスクにおける性能向上を実証しています。
この論文は、マルチモーダル大規模言語モデル(MLLM)における「マルチモーダルな安全性の非対称性」という新たな脆弱性を発見し、これを構造化された原子戦略プリミティブと強化学習に基づく多エージェント最適化を活用して、GPT-4o や Gemini などの商用モデルを含む黒箱モデルに対して既存手法を大幅に上回る攻撃成功率(平均 18.15% 向上、95% 超)を達成する新しいブラックボックス・ジェイルブレイクフレームワーク「PolyJailbreak」を提案するものである。
この論文は、人間の動的挙動をデータ駆動モデルで予測し、到達可能性に基づく安全性の保証を初期制御入力に限定することで、人間との 3 次元空間における安全かつ効率的なマイクロ航空機(MAV)のナビゲーションを実現するモデル予測制御(MPC)フレームワーク「HumanMPC」を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。
本論文は、インターネットや電力、ハードウェアが不足するバングラデシュの教育環境の制約を克服し、Minecraft を活用したゲーミフィケーション学習を可能にするための、3 つの展開階層とローカライズされたカリキュラムを提案する HCI 枠組みを提示しています。
本論文は、自律走行の知覚タスクにおける合成データの有用性を検証し、3D 資産を駆使して多視点のコーナーケースを大規模に生成する新たなフレームワーク「Dream4Drive」と大規模 3D アセットデータセット「DriveObj3D」を提案し、下流の知覚モデルの性能向上を実証しています。
本論文は、動的な Gaussian Splatting における多様な課題を解決するため、複数の専門家の出力を画素レベルで適応的に統合する「Volume-aware Pixel Router」を備えた Mixture of Experts 手法「MoE-GS」を提案し、最先端の描画品質と効率性を両立させることを示しています。
本論文は、Kubernetes 環境における Valkey、KeyDB、Garnet の Redis 代替候補をベンチマークし、スループットやレイテンシ、リソース効率、移行の複雑さ、そしてコミュニティの持続性などの観点から、それらのパフォーマンスと将来性を包括的に評価したものである。
本論文は、非専門家でも自然言語で分析意図を伝え、構造化されたリスク証拠を検証し、追跡可能な専門家スタイルの推論を得られるよう、ルール抽象化・証拠スコアリング・専門家風正当化の 3 つの役割を統合した人間中心のマルチエージェントシステム「HCLA」を提案し、暗号資産取引の異常検知において、ブラックボックスモデルの解釈ではなく、規制や調査判断に整合する追跡可能な推論プロセスの再構築を通じて、説明可能性を超えた説明責任と透明性の実現を目指すものである。