VoiceSHIELD-Small: Real-Time Malicious Speech Detection and Transcription
この論文は、音声からテキストへの変換と有害な音声コマンドの検出をリアルタイムかつ単一ステップで実行し、高い精度と低遅延を実現する軽量モデル「VoiceSHIELD-Small」を提案するものである。
7179 件の論文
この論文は、音声からテキストへの変換と有害な音声コマンドの検出をリアルタイムかつ単一ステップで実行し、高い精度と低遅延を実現する軽量モデル「VoiceSHIELD-Small」を提案するものである。
本論文は、イギリスのムスリム女性向けに共同設計された文化的・信仰に配慮したAIチャットボット「YAQIN」の開発と評価を通じて、医療システムにおける文化的障壁を克服し、信頼とエンゲージメントを向上させる可能性を示しています。
本論文は、LLM を二腕バンディット問題に適用した実験を通じて、モデルが報酬構造に関わらず位置順序や硬直な探索戦略に偏る決定バイアスを示し、学習率の低さと逆温度の高さという計算モデルで説明できることを明らかにし、これが人間-AI 協調における潜在的な課題を浮き彫りにしたことを述べています。
この論文は、大規模言語モデルの幻覚や誤り蓄積を軽減し、OpenSeesPy を用いた構造モデルの自動生成・解析の精度と効率を向上させるために、問題分析からコード変換までを分担する新しいマルチエージェント・アーキテクチャを提案し、20 のフレーム問題における高い成功率を実証したものである。
本論文は、大規模なパラメータを含む多様な離散最適化問題を用いた評価を通じて、LLM の性能や CoT 手法の有効性を実証し、自動解決への提言と将来の研究基準を提供するものである。
この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。
本論文は、対照的なクリーン・ノイズデータの不足やトレーサーの急速な動態といった課題を克服し、教師なし拡散モデル「DECADE」を用いて、Rb-82 心臓 PET 画像の時間的一貫性を保ちながらノイズを低減し、定量的な精度を維持する手法を提案しています。
この論文は、ハイブリッド RoBERTa エンコーダと大規模言語モデル(LLM)の予測レベルにおけるアンサンブル学習を組み合わせることで、多次元アスペクトベースの感情分析タスクにおける RMSE の大幅な削減と相関スコアの向上を達成したシステムを提案しています。
本論文は、ラベル付けされていない専門家動画からタスクの進捗を推定して報酬を学習し、敵対的更新と高速な JAX 基盤を統合することで、連続学習における忘却を抑制し、複雑な操作タスクの習得を可能にする「ProgAgent」という強化学習エージェントを提案しています。
本論文は、ネパールという未代表文化圏における大規模言語モデルの社会的バイアスを評価する「二重指標評価(DMBA)」フレームワークを提案し、明示的な同意バイアスと暗黙的な生成バイアスの間に強い相関がないこと、および温度パラメータやドメインによってバイアスの現れ方が異なることを実証しています。
本論文は、物理情報ニューラルネットワーク(PINN)に多ヘッド構造と主成分分析を組み合わせることで、粘性バース方程式の解空間を低次元の埋め込み空間として効率的に表現し、その物理的解釈性を保ちながら主要なダイナミクスを捉える手法を提案するものである。
この論文は、拡散モデルの生成プロセスを「編集」と見なし、画像の難易度に応じて大規模モデルと小規模モデルをピクセルおよびタイムステップレベルでハイブリッドに組み合わせることで、Stable Diffusion 3 において既存の手法を上回る 1.83 倍の高速化を実現する「HybridStitch」という新たな手法を提案しています。
本論文は、オンデマンド・マイクロトランジットのゾーニング問題を、候補ゾーンの個数制限ではなくグローバルな予算制約下で一般化し、列生成法と価格付けヒューリスティクスを用いて効率的に解く新たな枠組みを提案し、主要な米都市での数値実験によりその有効性を示しています。
本論文は、移動目標の勾配を計算することで半勾配法と競合する学習速度を実現し、Atari ゲームなど多様なベンチマークで勾配 TD 法の学習速度と安定性を両立させた「Gradient Iterated Temporal-Difference learning」を提案し、その有効性を示したものである。
この論文は、教育における AI 誤用を「検出」の問題ではなく、学習プロセスの可視性欠如という「測定」の問題として再定義し、監視ではなく透明性とプロセスの可視化を重視する「学習可視性フレームワーク」を提案しています。
本論文は、DistillGuard というフレームワークを用いて LLM の知識蒸留に対する出力レベルの防御策を体系的に評価した結果、現在の防御手法はタスク依存性が強く、特に単純な攻撃者に対しては広範な知識窃取を防ぐには不十分であることを示しています。
IBM が公開した「AI Steerability 360」は、プロンプト、構造、状態、出力の 4 つの制御面を統一的なパイプラインで操作し、複数の手法を組み合わせることで大規模言語モデルの制御と評価を容易にするオープンソースの Python ツールキットです。
この論文は、LLM エージェント間の対話における意図的な欺瞞を体系的に研究し、事実確認防御では見逃されがちな「誤導(真実の戦略的枠組み)」が主要な攻撃手法であり、特に特定の行動プロファイルや動機を標的とした攻撃が効果的であることを明らかにしています。
この論文は、強化学習単独では不十分な探索行動を改善するため、合成されたツール使用軌道を用いて冷たいスタート時の教師あり微調整を強化し、深層研究における探索を促進する「SynPlanResearch-R1」というフレームワークを提案し、複数のベンチマークで最先端の性能向上を実現したことを報告しています。
この論文は、生物学的な睡眠と記憶の再活性化に着想を得た「睡眠リプレイ統合(SRC)」という手法を提案し、教師あり再学習なしに人工ニューラルネットワークの過信問題を解決し、信頼性の高い確率推定を実現することを示しています。