cs 件の論文 | Gist.Science

DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

本論文は、複雑な数値・空間推論を必要とするテキストから画像への生成タスクにおいて、大規模な閉源モデルへの依存を排除し、軽量モデルでも高精度なレイアウト予測と段階的な画像合成を実現する「DivCon」という分割統治アプローチを提案し、HRS や NSR-1K ベンチマークで既存手法を上回る性能と多物体・複雑な関係性を有するプロンプトに対する知覚品質の向上を実証したものである。

Yuhao Jia, Wenhan Tan2026-03-10💻 cs

Deepfake Generation and Detection: A Benchmark and Survey

この論文は、ディープフェイクの生成（顔の入れ替え、再演、発話顔生成、属性編集）と検出に関する最新技術、データセット、評価指標を包括的にレビューし、代表的な手法をベンチマークして将来の課題と研究方向を分析する調査研究である。

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Weighted Reservoir Sampling With Replacement from Data Streams

この論文は、データストリームから重みに比例した確率で要素を復元抽出する新しい手法を提案し、その正当性と効率性を理論的に証明するとともに、実験を通じて既存手法との性能比較を行ったものである。

Adriano Meligrana, Adriano Fazzone2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

既存の顔認証モデルが人工的な画像劣化なしでも直面する課題（属性差の大きい同一人物ペア、属性差の小さい異人物ペア、双子や親族など似顔人物）を特定し、高品質な画像を用いた「Goldilocks」レベルの新たなテストセット（Hadrian、Eclipse、ND-Twins）を提案する論文です。

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

RDM: Recurrent Diffusion Model for Human Motion Generation

この論文は、従来の拡散モデルが抱える計算コストや系列長の制限を克服し、正規化フローを用いて再帰的な条件付けを確率的に実現することで、長系列の人間運動を高精度かつ効率的に生成する新しい「RDM（再帰的拡散モデル）」を提案するものです。

Mirgahney Mohamed, Harry Jake Cunningham, Marc P. Deisenroth, Lourdes Agapito2026-03-10💻 cs

Influence-Based Reward Modulation for Implicit Communication in Human-Robot Interaction

この論文は、転移エントロピーを用いてエージェント間の影響力を報酬に組み込むことで、人間の意図や事前知識に依存せず、協働や競争のシナリオにおけるロボットと人間の間の暗黙的コミュニケーションを促進する手法を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。

Haoyang Jiang, Elizabeth A. Croft, Michael G. Burke2026-03-10💻 cs

On Polynomial-Time Decidability of k-Negations Fragments of First-Order Theories

本論文は、特定の固定パラメータ易解性要件を満たす一階理論の固定否定数フラグメントが多項式時間で決定可能であるための一般的な枠組みを提示し、弱プレスバーガー算術や弱線形実数算術などの具体例において、Nguyen と Pak による Presburger 算術の制限されたフラグメントの NP 困難性とは対照的に多項式時間決定可能性を証明している。

Christoph Haase, Alessio Mansutti, Amaury Pouly2026-03-10💻 cs

MORCoRA: Multi-Objective Refactoring Recommendation Considering Review Availability

本論文は、コード品質の向上とレビュー担当者の専門性及び業務負荷を考慮したリファクタリング提案を行うための多目的探索手法「MORCoRA」を提案し、その有効性を複数のオープンソースリポジトリを用いて実証したものである。

Lei Chen, Shinpei Hayashi2026-03-10💻 cs

A 1.6-fJ/Spike Subthreshold Analog Spiking Neuron in 28 nm CMOS

この論文は、28nm CMOS 技術を用いて 1.6fJ/spike の超低消費電力を実現したアナログスパイキングニューロンを設計・実装し、MNIST 認識タスクにおいて 82.5% の精度を達成した埋め込み機械学習向けの高効率ニューロモルフィック SoC の実現可能性を示したものである。

Marwan Besrour, Takwa Omrani, Jacob Lavoie, Gabriel Martin-Hardy, Esmaeil Ranjbar Koleibi, Jeremy Menard, Konin Koua, Philippe Marcoux, Mounir Boukadoum, Rejean Fontaine2026-03-10💻 cs

Life Histories of Taboo Knowledge Artifacts

この混合研究法による比較プロジェクトは、ウィキペディアにおけるタブー知識の生成と維持の過程を分析し、その発展における 6 つのテーマを特定するとともに、限定的な識別性と断片的な意味付けという条件下でタブー記事が存続するために必要なレジリエントなリーダーシップや組織的関与、そして参加者のガバナンスと公衆の想像力について明らかにした。

Kaylea Champion, Benjamin Mako Hill2026-03-10💻 cs

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

本論文は、音声と動画データを統合して喉頭動画から重要なセグメントを抽出し、拡散モデルによる精緻化や角度偏差測定を用いて声帯麻痺の検出精度を向上させた支援診断システム「MLVAS」を提案し、その有効性を実証したものである。

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

この論文は、AI を活用したテストケース生成と検証が、従来のソフトウェアテストが抱える課題を解決し、効率性・精度・拡張性を飛躍的に向上させる可能性と、その実装における課題や実用例について考察している。

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Safe Navigation of Bipedal Robots via Koopman Operator-Based Model Predictive Control

この論文は、深層強化学習で学習した歩行ポリシーの低周波動的を高次元空間で線形化するコップマン演算子に基づくモデル予測制御を提案し、複雑な非線形挙動を示す二足歩行ロボットの安全なナビゲーションと狭い通路を有する密集環境での成功率向上を実現することを示しています。

Jeonghwan Kim, Yunhai Han, Harish Ravichandar, Sehoon Ha2026-03-10💻 cs

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

本論文は、患者・医師・家族の多角的な相互作用を可能にし、検索拡張生成（RAG）と思考連鎖（CoT）技術を活用して大規模言語モデルの幻覚を抑制し、解釈可能性と診断精度を向上させたうつ病評価システム「InterMind」を提案するものである。

Zhiyuan Zhou, Jilong Liu, Sanwang Wang, Shijie Hao, Yanrong Guo, Richang Hong2026-03-10💻 cs

Improving Visual Object Tracking through Visual Prompting

CLIP などの事前学習済み基盤モデルを活用してオンラインで視覚的プロンプトを自動生成・更新し、対照的なガイダンスを通じて不要な対象を抑制することで汎用オブジェクトトラッキングの性能を向上させる新しい手法「PiVOT」を提案する論文です。

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Diagnosing and Repairing Distributed Routing Configurations Using Selective Symbolic Simulation

分散型ルーティング設定の自動診断と修復を可能にする新システム「S^2Sim」は、設定のバリエーションを選択的に記号的にシミュレーションすることで意図に合致する修正版を特定し、その差分からエラーを特定してパッチを提案する。

Rulan Yang, Gao Han, Hanyang Shao, Xiaoqiang Zheng, Xing Fang, Ziyi Wang, Lizhao You, Ruiting Zhou, Linghe Kong, Ennan Zhai, Qiao Xiang, Jiwu Shu2026-03-10💻 cs

Pose Prior Learner: Unsupervised Categorical Prior Learning for Pose Estimation

本論文は、人間の注釈を必要とせず画像から物体カテゴリの一般的な姿勢事前分布を学習する「Pose Prior Learner」を提案し、その階層的メモリと反復推論によって、特に遮蔽された画像における姿勢推定の精度を向上させることを示しています。

Ziyu Wang, Shuangpeng Han, Mengmi Zhang2026-03-10💻 cs

ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance

この論文は、音声とテキストの情報を同期させて拡散モデルを用いることで、感情や移動を含む表現豊かな全身ジェスチャーを生成する新しいフレームワーク「ExpGest」を提案し、既存の手法よりも自然で制御性の高い結果を実現したことを示しています。

Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu2026-03-10💻 cs

Optimal Mediation Mechanism in Bilateral Trade

この論文は、バイヤーの評価がセラーの私的情報に依存する双方向取引において、仲介者が収益を最大化するための最適メカニズムを分析し、インセンティブ整合性・服従性・情報提供の同時達成が不可能であることを示した上で、セラーの費用が一定の場合や仲介者が拒否権を持つ場合の最適メカニズムがそれぞれ異なる閾値構造を持つことを明らかにしている。

Zhikang Fan, Weiran Shen, Shaojie Tang, Yao Wang2026-03-10💻 cs

I/O complexity and pebble games with partial computations

本論文は、従来の赤青ペブルゲームの制約を緩和し部分計算を可能にする新たなモデルを提案し、その最適戦略の決定問題が単一レベルの DAG や極めて限られたメモリサイズの場合でも NP 完全であることを示すとともに、特殊ケースに対する近似アルゴリズムを概説しています。

Aleksandros Sobczyk2026-03-10💻 cs

← 前へ次へ →