cs.AI 件の論文 | Gist.Science

Dynamic Chunking Diffusion Transformer

本論文は、画像の領域ごとの情報量や拡散段階に応じてトークン数を動的に調整する「Dynamic Chunking Diffusion Transformer（DC-DiT）」を提案し、事前学習済みモデルからの効率的なアップサイクルを可能にしながら、計算コストを削減しつつ生成品質を向上させることを実証しています。

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

この論文は、高次元の産業データにおけるノイズや冗長性を抑制し、潜在空間の学習とゲーム理論に基づく解釈可能性を統合したハイブリッド深層学習フレームワーク「CLAIRE」を提案し、スマート製造における高精度な故障検出と説明可能な AI の実現を示しています。

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

ESAA-Security: An Event-Sourced, Verifiable Architecture for Agent-Assisted Security Audits of AI-Generated Code

本論文は、AI 生成コードのセキュリティ監査において、LLM との自由な対話ではなく、イベントソーシングと検証可能なアーキテクチャを用いて、再現性のある証拠に基づく監査プロセスを実現する「ESAA-Security」フレームワークを提案しています。

Elzo Brito dos Santos Filho2026-03-09🤖 cs.AI

Kinetic-based regularization: Learning spatial derivatives and PDE applications

この論文は、離散かつノイズの多いデータから空間微分を学習するための「運動学的正則化（KBR）」を拡張し、明示的・陰的の 2 種類の手法を提案することで、1 次元 PDE の安定した衝撃波捕捉や不規則な点群上での保存則の維持を実現する手法を示しています。

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Prompt Group-Aware Training for Robust Text-Guided Nuclei Segmentation

本論文は、セマンティックに同等なプロンプト間の一貫性を欠くという SAM3 の課題を「プロンプトグループ」概念で再定義し、品質誘導正則化とロジットレベルの整合性制約を導入することで、アーキテクチャ変更なしにテキスト誘導核分割のロバスト性と汎化性能を大幅に向上させるフレームワークを提案しています。

Yonghuang Wu, Zhenyang Liang, Wenwen Zeng, Xuan Xie, Jinhua Yu2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

この論文は、大規模言語モデルによる自然言語での柔軟な指示と科学的ワークフローに必要な厳密な実行の両立を可能にするため、実行前にスキーマによる検証を義務付ける「スキーマゲート型オーケストレーション」を提案し、その有効性を多モデル評価を通じて実証しています。

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

Physical Simulator In-the-Loop Video Generation

この論文は、拡散モデルで生成された動画に物理シミュレータを統合して物体の運動軌跡を物理法則に準拠させ、さらにテスト時のテクスチャ最適化手法により一貫性を高めることで、物理的に整合性が高く視覚的品質も保たれた動画生成を実現する「PSIVG」という新しいフレームワークを提案しています。

Lin Geng Foo, Mark He Huang, Alexandros Lattas, Stylianos Moschoglou, Thabo Beeler, Christian Theobalt2026-03-09🤖 cs.AI

A Reference Architecture of Reinforcement Learning Frameworks

本論文は、強化学習フレームワークのアーキテクチャパターンに共通基盤を欠くという課題に対処するため、グラウンデッド・セオリーを用いた 18 のフレームワーク分析に基づき、参照アーキテクチャを提案し、その有効性を示すとともに将来の改善方向を明らかにするものである。

Xiaoran Liu, Istvan David2026-03-09🤖 cs.AI

CLoPA: Continual Low Parameter Adaptation of Interactive Segmentation for Medical Image Annotation

本論文は、既存のゼロショットモデル「nnInteractive」の少数パラメータを継続的に適応させる「CLoPA」を提案し、多様な医療画像タスクにおいて単一のトレーニングエピソードで専門家レベルの性能を達成し、特に複雑な幾何学構造を持つ標的においても効果的であることを示しています。

Parhom Esmaeili, Chayanin Tangwiriyasakul, Eli Gibson, Sebastien Ourselin, M. Jorge Cardoso2026-03-09🤖 cs.AI

Abductive Reasoning with Syllogistic Forms in Large Language Models

本論文は、大規模言語モデル（LLM）が演繹だけでなく帰納的推論（アブダクション）においても人間と同様のバイアスを示すかどうかを、三段論法形式のデータセットを変換して検証し、文脈に即した推論の重要性を明らかにするものである。

Hirohiko Abe, Risako Ando, Takanobu Morishita Kentaro Ozeki, Koji Mineshima, Mitsuhiro Okada2026-03-09🤖 cs.AI

Prosodic Boundary-Aware Streaming Generation for LLM-Based TTS with Streaming Text Input

本論文は、事前学習済み LLM 音声合成モデルを弱時間整合データで適応させ、限定的な未来テキストに基づいて内容境界で早期停止を学習するプロソディ境界認識型ポストトレーニング戦略とスライディングウィンドウ推論を提案し、ストリーミングテキスト入力における不自然なプロソディと長文生成の崩壊を解決し、CosyVoice 型ベースラインを短・長文両面で上回る性能を実現したものである。

Changsong Liu, Tianrui Wang, Ye Ni, Yizhou Peng, Eng Siong Chng2026-03-09🤖 cs.AI

Do Foundation Models Know Geometry? Probing Frozen Features for Continuous Physical Measurement

本論文は、視覚言語モデルの凍結された特徴空間にテキスト生成経路では表現され得ない連続的な幾何学情報が埋め込まれており、軽量な線形プローブを用いることで微調整やテキスト生成なしに高精度な物理測定が可能であることを実証しています。

Yakov Pyotr Shkolnikov2026-03-09🤖 cs.AI

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

この論文は、ユーザーの専門性や目標に応じた信頼性の高い説明を生成するために、LLM のハルシネーションを防ぎつつフィードバックループで個人化を実現する XAI 枠組み「PONTE」を提案し、医療・金融分野での評価でその有効性を示したものである。

Vittoria Vineis, Matteo Silvestri, Lorenzo Antonelli, Filippo Betello, Gabriele Tolomei2026-03-09🤖 cs.AI

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

本論文では、事前学習から適用可能な新しいアーキテクチャ拡張「NOBLE」を提案し、非線形低ランク分岐をトランスフォーマーの線形層に追加することで、最小限のパラメータ増加と計算コストでトレーニング効率を大幅に向上させることを示しています。

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics

COLD-Steer は、ラベル付き例からの勾配降下による表現変化を推論時に近似することで、従来の手法に比べて 50 倍少ないサンプル数で大規模言語モデルの振る舞いを効率的に制御するトレーニング不要なフレームワークです。

Kartik Sharma, Rakshit S. Trivedi2026-03-09🤖 cs.AI

Artificial Intelligence for Detecting Fetal Orofacial Clefts and Advancing Medical Education

この論文は、22 病院の 9,215 人の胎児から得られた 45,139 枚超の超音波画像で学習した AI システムが、口唇口蓋裂の診断において経験豊富な放射線科医と同等の精度を達成し、若手医師の診断精度向上と専門知識の習得加速の両方に寄与する可能性を示したものである。

Yuanji Zhang, Yuhao Huang, Haoran Dou, Xiliang Zhu, Chen Ling, Zhong Yang, Lianying Liang, Jiuping Li, Siying Liang, Rui Li, Yan Cao, Yuhan Zhang, Jiewei Lai, Yongsong Zhou, Hongyu Zheng, Xinru Gao, Cheng Yu, Liling Shi, Mengqin Yuan, Honglong Li, Xiaoqiong Huang, Chaoyu Chen, Jialin Zhang, Wenxiong Pan, Alejandro F. Frangi, Guangzhi He, Xin Yang, Yi Xiong, Linliang Yin, Xuedong Deng, Dong Ni2026-03-09🤖 cs.AI

← 前へ次へ →

cs.AI